Ejercicios resueltos de la asignatura "Aprendizaje por refuerzo" del Máster Universitario en Ciencia de Datos (Data Science) de la Universitat Oberta de Catalunya (UOC): https://estudios.uoc.edu/es/masters-universitarios/data-science/presentacion
Este repositorio incluye ejemplos resueltos de los diferentes módulos didácticos de la asignatura.
Los módulos didácticos son:
- Módulo 1. Introducción al aprendizaje por refuerzo
- Módulo 2. Introducción a OpenAI Gym
- Módulo 3. Procesos de decisión de Markov
- Módulo 4. Programación dinámica
- Módulo 5. Métodos de Montecarlo
- Módulo 6: Métodos de Diferencia Temporal
- Módulo 7. N-step bootstrapping
- Módulo 8. Introducción a las soluciones aproximadas
- Módulo 9: Deep Q-Networks
- Módulo 10: Gradientes de Política
- Módulo 11. El método actor-crítico
Dentro de cada carpeta de este respositorio se pueden encontrar uno o más ejemplos relacionados con el módulo. El idioma de los ejemplos se indica mediante una sufijo en cada notebook, indicando si se trata de ejemplos en catalán, castellano o inglés según la siguiente nomenclatura:
- [ca]: Notebooks de ejemplo en catalán
- [es]: Notebooks de ejemplo en castellano
- [en]: Notebooks de ejemplo en inglés