Lecciones de Juego para un Robot
tdgamon
badgamon
eblue (ajedrez)
watson (ensamble de muchos modelos de aprendizaje)
Inteligencia artificial
NOTA: Hacer un repaso de todo lo que aprendi en la maestria
El core sería:
Agente - ambiente - recompensas
Sistema multiagentes
Psicologia conductista
Aprendizaje por recompensa
D3.js
Programación dinámica
Encontrar solución exacta en un ambiente y un agente
Juego con emojis: en un grid en un laberinto, casillas con castigos y premios
Búsquedas exhaustivas
https://www.codechef.com/wiki/tutorial-dynamic-programming
https://www.amazon.com/dp/0262032937/?tag=stackoverfl08-20
http://stackoverflow.com/questions/1065433/what-is-dynamic-programming
https://people.eecs.berkeley.edu/~vazirani/algorithms/chap6.pdf
https://www.hackerrank.com/domains/algorithms/dynamic-programming
http://www.geeksforgeeks.org/category/algorithm/dynamic-programming/
Montecarlo
Método de suerte
Diferencia temporal
Es lo mejor de programacion dinamica y montecarlo