AlphaZero

AlphaZero es un programa informático desarrollado por DeepMind, que es el predecesor generalizado de AlphaGo Zero. El 5 de diciembre de 2017, el equipo de DeepMind lanzó una preimpresión presentando AlphaZero, que logró en 24 horas un nivel de juego sobrehumano en ajedrez, shogi y Go al derrotar a los campeones del mundo, Stockfish, Elmo y la versión de 3 días de AlphaGo Zero en cada caso. AlphaZero dominó a Stockfish después de solo 4 horas de autoaprendizaje, sin acceso a libros de apertura o base de datos de tablas de finales.^[1]^[2]^[3]

En 2019 se implementó una versión libre del mismo conocida como KataGo. (Ver «New Go-playing trick defeats world-class Go AI, but loses to human amateurs». Consultado el 8 de junio de 2023. Este artículo de 2022 describe una estrategia ganadora que permite a cualquier amateur vencer a dichos programas^[4].) No obstante, estos sistemas siguen en investigación y mejoran continuamente.

↑ Error en la cita: Etiqueta <ref> no válida; no se ha definido el contenido de las referencias llamadas Silver et al
↑ «Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours» (en inglés británico). Telegraph.co.uk. 6 de diciembre de 2017. Consultado el 6 de diciembre de 2017.
↑ «DeepMind’s AI became a superhuman chess player in a few hours, just for fun». The Verge. 6 de diciembre de 2017. Consultado el 6 de diciembre de 2017.
↑ https://deepai.org/profile/tony-tong-wang (1 de noviembre de 2022). «Adversarial Policies Beat Professional-Level Go AIs». DeepAI. Consultado el 8 de junio de 2023.

[Silver_et_al-1] Error en la cita: Etiqueta <ref> no válida; no se ha definido el contenido de las referencias llamadas Silver et al

[telegraph-2] «Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours» (en inglés británico). Telegraph.co.uk. 6 de diciembre de 2017. Consultado el 6 de diciembre de 2017.

[3] «DeepMind’s AI became a superhuman chess player in a few hours, just for fun». The Verge. 6 de diciembre de 2017. Consultado el 6 de diciembre de 2017.

[4] ttps://deepai.org/profile/tony-tong-wang (1 de noviembre de 2022). «Adversarial Policies Beat Professional-Level Go AIs». DeepAI. Consultado el 8 de junio de 2023.

[1]

[2]

[3]

[4]