-
Notifications
You must be signed in to change notification settings - Fork 30
Pull requests: hfbassani/RLBookExercises
Author
Label
Projects
Milestones
Reviews
Assignee
Sort
Pull requests list
Exercícios 1.1, 4.5, 6.9, 6.10, 8.3, 8.5, 12.2
Capítulo 1
Introduction
Capítulo 4
Dynamic Programming
Capítulo 6
Temporal-Difference Learning
Capítulo 8
Planning and Learning with Tabular Methods
#52
opened Jul 1, 2021 by
marvson
Loading…
Questões de RL
Capítulo 1
Introduction
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 4
Dynamic Programming
Capítulo 9
On-policy Prediction with Approximation
Exercicios 1º nota - Carlos Antônio Alves Júnior
Capítulo 1
Introduction
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
Capítulo 8
Planning and Learning with Tabular Methods
Exercícios Samuel Gonçalves
Capítulo 1
Introduction
Capítulo 3
Finite Markov Decision Processes
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
Capítulo 9
On-policy Prediction with Approximation
Exercícios - 1.3, 2.2, 3.1, 4.2, 4.5, 5.1, 5.2, 6.1, 6.4 e 6.6
Capítulo 1
Introduction
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 4
Dynamic Programming
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
Exercícios 2.2, 2.10, 3.4, 3.9, 4.1, 4.6, 5.4, 5.5, 6.3 e 6.6
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 4
Dynamic Programming
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
exercicios 1.1, 2.3, 3.1, 4.2, 5.1, 6.2, 8.2, 9.2
Capítulo 1
Introduction
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 4
Dynamic Programming
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
Capítulo 8
Planning and Learning with Tabular Methods
Capítulo 9
On-policy Prediction with Approximation
Exercícios
Capítulo 1
Introduction
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 4
Dynamic Programming
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
Capítulo 7
n-step Bootstrapping
Capítulo 8
Planning and Learning with Tabular Methods
Capítulo 10
Exercícios 3.6, 4.2, 5.1, 5.2, 6.3, 6.11, 7.1, 9.1, 9.6, 9.7
Capítulo 3
Finite Markov Decision Processes
Capítulo 4
Dynamic Programming
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
Capítulo 7
n-step Bootstrapping
Capítulo 9
On-policy Prediction with Approximation
Alterações propostas por Evair
Capítulo 1
Introduction
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 4
Dynamic Programming
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
Capítulo 7
n-step Bootstrapping
Capítulo 8
Planning and Learning with Tabular Methods
Exercicios - Julio Silva
Capítulo 1
Introduction
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 4
Dynamic Programming
Capítulo 5
Monte Carlo Methods
Capítulo 6
Temporal-Difference Learning
Capítulo 7
n-step Bootstrapping
Exercícios 1.1, 2.1, 3.2 e 5.3
Capítulo 1
Introduction
Capítulo 2
Multi-armed Bandits
Capítulo 3
Finite Markov Decision Processes
Capítulo 5
Monte Carlo Methods
Previous Next
ProTip!
Updated in the last three days: updated:>2024-11-05.