Lecciones de Juego para un Robot

tdgamon

badgamon

eblue (ajedrez)

watson (ensamble de muchos modelos de aprendizaje)

Inteligencia artificial

NOTA: Hacer un repaso de todo lo que aprendi en la maestria

El core sería:

Agente - ambiente - recompensas

Sistema multiagentes

Psicologia conductista

Aprendizaje por recompensa

D3.js

Programación dinámica

Encontrar solución exacta en un ambiente y un agente

Juego con emojis: en un grid en un laberinto, casillas con castigos y premios

Búsquedas exhaustivas

https://www.topcoder.com/community/data-science/data-science-tutorials/dynamic-programming-from-novice-to-advanced/

https://www.codechef.com/wiki/tutorial-dynamic-programming

https://www.amazon.com/dp/0262032937/?tag=stackoverfl08-20

http://stackoverflow.com/questions/1065433/what-is-dynamic-programming

https://people.eecs.berkeley.edu/~vazirani/algorithms/chap6.pdf

https://www.hackerrank.com/domains/algorithms/dynamic-programming

https://www.hackerearth.com/practice/algorithms/dynamic-programming/introduction-to-dynamic-programming-1/tutorial/

http://www.geeksforgeeks.org/category/algorithm/dynamic-programming/

Montecarlo

Método de suerte

Diferencia temporal

Es lo mejor de programacion dinamica y montecarlo

results matching ""

    No results matching ""