Repositório de Aprendizado por Reforço desenvolvido pelo Turing USP.
Introdução ao Aprendizado por Reforço e apresentação de conceitos básicos da área.
Conceitos importantes de Aprendizado por Reforço como Temporal Difference Learning e implementações de diversos Algoritmos Tabulares.
Descrição e implementação de algoritmos modernos de Aprendizado por Reforço com redes neurais.
Agradecimentos a todos esses contribuidores (emoji key):
arielguerreiro 💻 📖 |
Bernardo Coutinho 💻 📖 👀 |
Eduardo Eiras 💻 📖 👀 |
Fernando Matsumoto 💻 📖 👀 🔧 |
Luis Henrique de Almeida Fernandes 💻 📖 |
Nelson Alves Yamashita 💻 📖 👀 |
FelipeAugustoMachado 👀 |
Rafael Araujo Coelho 👀 |
Esse projeto segue a especificação all-contributors. Qualquer contribuidor é bem vindo!