reinforcement learning models like sarsa (state-action-reward-state-action)

An algorithm for learning a Markov decision process policy, used for finding a suitable action model to take in a given state.