Armando Guedez Rodríguez: AlphaZero, la máquina que aprende de manera autónoma a ganar
Ajedrez

Armando Guedez Rodríguez: AlphaZero, la máquina que aprende de manera autónoma a ganar

El objetivo está lejos, conseguir una sola máquina capaz de enfrentarse a cualquier reto o tarea sin ayuda. Hasta ahora, los grandes logros de la inteligencia artificial se generan con máquinas dedicadas específicamente a una tarea, entrenadas para ello en una condiciones muy concretas, incapaces de adaptarse a un cambio sustancial. Pero los pasitos que se van dando hacia ese objetivo son firmes.

El último progreso lo firma DeepMind, que ha conseguido que un mismo programa se convierta en invencible en ajedrez, shogi (una versión japonesa del juego) y go, los tres juegos de tablero más exigentes para el intelecto. Pero el mundo real es mucho más complejo e imprevisible.

Armando Guedez Rodríguez: AlphaZero, la máquina que aprende de manera autónoma a ganar

El logro de DeepMind, la división de inteligencia artificial de Google, promete generar importantes avances. Este programa, llamado AlphaZero, ha aprendido solo a jugar sobre estos difíciles tableros, como explican sus desarrolladores en la revista Science. 

De cero (de ahí su nombre), sin ayuda ni ejemplos de jugadores reales. En otras ocasiones, el ordenador aprendía porque lo alimentaban con todo el conocimiento humano, millones de jugadas y ejemplos reales, y a partir de ahí el cerebro de silicio elegía las mejores estrategias.

Armando Guedez Rodríguez: AlphaZero, la máquina que aprende de manera autónoma a ganar

Deep Blue venció así a KaspárovY AlphaGo venció así a Lee Sedol. Pero AlphaZero aprende de sí mismo y en apenas un puñado de horas; tan solo le explican las reglas del juego y a partir de ahí ha sido capaz de convertirse en el mejor jugador de todos los tiempos en estas tres disciplinas.

Los programas que mejor juegan al ajedrez, al shogi y al go, sin rival entre los humanos y diseñados durante años específicamente para esta tarea apenas son capaces de arañar una victoria entre miles de derrotas.

Es más, esta inteligencia artificial es capaz de vencer con una mano atada a la espalda. Al enfrentarse ordenadores contra ordenadores, se otorgaban unos tiempos a cada aparato para pensar su movimiento.

La inteligencia de AlphaZero era tan superior que ganaba incluso cuando se le concedía tan solo una décima parte del tiempo que a sus rivales para procesar la información y mover. Y no es una cuestión de potencia computacional, es porque se le ha otorgado una forma de razonar más profunda y selectiva. En ajedrez, valora únicamente 60.000 posibilidades por segundo frente a los 60 millones de opciones que baraja su rival, Stockfish, el más potente jugador de ajedrez hasta ahora. El algoritmo busca solo entre los movimientos más prometedores.

Armando Guedez Rodríguez: AlphaZero, la máquina que aprende de manera autónoma a ganar

En ajedrez, se habla de cómo sus piezas se arremolinan en torno al rey del oponente con fuerza, dinamismo y determinación. Desprecia el valor material de las piezas y prefiere hacer sacrificios impensables desde el principio de la partida porque al final merecerá la pena.