En este curso se incluye todo lo básico relacionado con el Aprendizaje por Refuerzo. Desde los conceptos más básicos, como qué es una cadena de Markov, hasta conceptos más interesantes como la inclusión de Redes Neuronales en algoritmos de RL. Para ello, cada una de las clases cuenta con un Jupyter Notebook ejecutable con toda la teoría y con imágenes de esquemas que ayudan a una mejor comprensión. Esta pensado para que sea un curso desde 0, por ello, tanto si eres principiante, como si quieres refrescar conocimientos, este curso es para ti.
Este curso está dividido en varias partes:
Para ejecutar los notebooks la mejor forma es usar docker. En apenas unos minutos y sin instalar nada tendrás acceso a todos los notebooks. 🤯
- Agente y Entorno
- Recompensas, Observaciones y Acciones
- Equilibrio Exploración Explotación
- Maximizar la Recompensa a largo plazo
- Descubriendo Gym: Creando mi primer entorno
- Descubriendo Gym: Creando mi primer agente
- V-table: asignando un valor a cada estado
- Ecuación de Bellman: calculando V para cada estado
- Cálculo de la Política usando la V-table
- Las acciones en los Procesos de decisión de Markov
- Q: El valor de las acciones
- Programación Dinámica: Iteración de Valores
- Diferencias Temporales: Q-learning
- Alpha: aprender más de lo nuevo o de lo viejo
- Gamma: cuanto más lejos en el futuro menos confianza
- La política Óptima
1. Instala el Plugin de VSCode de Remote Containers
# Presiona Ctrl + shift + p
# Pega ext install ms-vscode-remote.remote-containers
# Presiona Enter
2. Abre el entorno de desarrollo
# Presiona Ctrl + shift + p
# Busca: Remote-Containers: Rebuild and Reopen in container
# Presiona Enter (y espera, la primera vez tarda unos minutos)
3. Abre los Notebooks
Abre el buscador y ve a http://127.0.0.1:8888/