Искусственный интеллект победил лучшего шахматиста, ничего не зная об игре
Теперь AlphaZero — лучший игрок в шахматы на планете Земля. В турнире против Stockfish 8, лучшей программы для игры в шахматы, система, созданная компанией Deepmind, не проиграла не единой игры из 100 проведенных партий.
AlphaZero — это модифицированная версия AlphaGo Zero, искусственного интеллекта, недавно выигравшего 100 раз подряд в го у знаменитого AlphaGo, того самого, что победил в го лучших человеческих игроков.
Система работает практически идентично с AlphaGo Zero, но вместо го машина запрограммирована играть в шахматы и сёги, еще одну японскую стратегическую игру. Свое мастерство AlphaZero приобрел без посторонней помощи, в отличие от всех предыдущих шахматных программ у него не было никаких эмпирических данных, никакой базы с архивами уже сыгранных шахматных партий, никакого знания о шахматных стратегиях и фигурах. Он просто знал, как ходят фигуры, и цель игры. Так указано в недавно опубликованной статье, посвященной этому турниру.
Можно подумать, что AlphaZero научился играть в шахматы за четыре часа, но это не совсем точно. Скорее AlphaZero научился, как стать абсолютным чемпионом по шахматам за четыре часа. Когда турнир начался, ИИ знал, как ходят фигуры. Начав с чистого листа и вооружившись обучающим алгоритмом подкрепления, нейросетью и фигурами на доске перед ним, AlphaZero начал играть сам с собой, снова и снова, оттачивая свои навыки с каждой партией, и если говорить человеческими понятиями времени, провел за игрой в шахматы около 1400 лет за эти четыре часа. Система может обработать 800 000 позиций за секунду, тогда как Stockfish 8 может провести 70 миллионов ходов за секунду.
Затем он таким же образом за восемь часов сумел превзойти AlphaGo в го, и за два часа — программу Elmo, которая раньше считалась неоспоримым чемпионом по игре в сёги
AlphaZero — это модифицированная версия AlphaGo Zero, искусственного интеллекта, недавно выигравшего 100 раз подряд в го у знаменитого AlphaGo, того самого, что победил в го лучших человеческих игроков.
Система работает практически идентично с AlphaGo Zero, но вместо го машина запрограммирована играть в шахматы и сёги, еще одну японскую стратегическую игру. Свое мастерство AlphaZero приобрел без посторонней помощи, в отличие от всех предыдущих шахматных программ у него не было никаких эмпирических данных, никакой базы с архивами уже сыгранных шахматных партий, никакого знания о шахматных стратегиях и фигурах. Он просто знал, как ходят фигуры, и цель игры. Так указано в недавно опубликованной статье, посвященной этому турниру.
Можно подумать, что AlphaZero научился играть в шахматы за четыре часа, но это не совсем точно. Скорее AlphaZero научился, как стать абсолютным чемпионом по шахматам за четыре часа. Когда турнир начался, ИИ знал, как ходят фигуры. Начав с чистого листа и вооружившись обучающим алгоритмом подкрепления, нейросетью и фигурами на доске перед ним, AlphaZero начал играть сам с собой, снова и снова, оттачивая свои навыки с каждой партией, и если говорить человеческими понятиями времени, провел за игрой в шахматы около 1400 лет за эти четыре часа. Система может обработать 800 000 позиций за секунду, тогда как Stockfish 8 может провести 70 миллионов ходов за секунду.
Затем он таким же образом за восемь часов сумел превзойти AlphaGo в го, и за два часа — программу Elmo, которая раньше считалась неоспоримым чемпионом по игре в сёги
Комментарии 0