Советы для чемпиона

Мир Go находится в состоянии шока, как мы уже сообщали в предыдущем посте. Впервые компьютерная программа избили профессионального игрока. Компьютерная программа, стоящая за этим подвигом AlphaGo, разработана компанией Google Deep Mind и использует несколько передовых технологий (подробнее см. Наш предыдущий пост). Результат был новаторским, потому что Go – азиатская игра с гораздо большим количеством возможностей, чем шахматы, – рассматривалась как святой Грааль ИИ. Считалось, что компьютеры должны иметь возможность отображать интуицию, чтобы играть на высшем уровне – теперь кажется, что они могут это сделать.

Все может скоро ухудшиться для человечества. С 9 марта по 15 марта AlphaGo будет играть против 9-линга Ли Седола (Южная Корея), одного из лучших игроков в мире. Матч состоится в Сеуле и будет сыгран в течение пяти матчей с призовым фондом в 1 миллион долларов. Будет ли Ли Седол защищать последний бастион человеческой гордости против ИИ?

Fernand Gobet
Источник: Фернан Гобет

Южная Корея является одной из ведущих стран Go, где ее называют «бакук», а не японским именем. (Возможно, AlphaGo следует переименовать в AlphaBaduk для этого матча). Тридцать три года Ли Седол уверен, что он победит, но сообщество Go не так уверенно.

С положительной стороны, Ли Седол намного сильнее, чем Фань Хуэй, чемпион мира 2-dan и чемпион Европы, который проиграл 0 – 5 в AlphaGo в октябре прошлого года. Разница аналогична разнице в шахматах между мастером и топ-гроссмейстером. Ожидается, что Ли Седол выиграет большинство игр против Фань Хуэй.

С отрицательной стороны, Фань Хуэй потерял все игры в матче, что явно указывает на то, что AlphaGo намного превосходит профессионала 2-dan. Вероятно, Google Deep Mind будет использовать улучшенную версию. Например, AlphaGo воспользовалась пятью дополнительными месяцами обучения с октября, с более мастер-играми, чтобы улучшить свою оценку позиций и выбор своего хода. Он также может использовать более мощное оборудование, а также использовать открытую базу данных, которую он не делал в предыдущем матче. Это позволило бы использовать человеческие знания в первых ходах и тем самым избегать нижних линий открытия.

Какую стратегию должен принять Ли Седол?

Некоторые могут пренебрежительно утверждать, что давление оказывает «все в вашей голове», но, как показало новое исследование (Chib, Shimojo, & O'Doherty, 2014), давление оставляет реальный неврологический след, побуждающий людей «задыхаться» и выполнять ниже своих уровень способности. Во время матча Седол будет испытывать значительное психологическое давление, учитывая, что мировое внимание оно поднимет. Он кажется уверенным и уже говорит о матче-реванше, который является хорошим отношением, если только он не станет чрезмерным. В своем матче против Deep Blue в 1997 году чемпион мира по шахматам Гари Каспаров плохо справлялся с давлением и делал серьезные ошибки (Hsu, 2002). Существует несколько методов, которые Седол может использовать для психологической подготовки. Он может играть против компьютерных программ, чтобы он привык играть в машины. Поскольку доступные компьютерные программы намного слабее, чем AlphaGo, он должен выбирать сложные позиции, которые он затем будет играть против компьютера; это включает игры, где он начинается с материального недостатка. Очевидно, что он должен практиковать с контролем времени, согласованным для матча.

Если возможно, он должен смотреть на игры, которые играет Alpha-Go, чтобы он мог идентифицировать определенные недостатки. В идеале, контракт матча должен был предусмотреть, что команда Alpha-Go должна регулярно предлагать такие игры во время подготовки к матчу. Учитывая рекламу, которую создаст конкурс, мы сомневаемся, что это так. В целом, сила AlphaGo также является ее слабостью: ей нужны миллионы позиций, чтобы учиться и использовать большое количество мастер-игр, потому что гораздо меньше игр игроков верхнего уровня, конкурирующих друг с другом. Таким образом, его игра моделируется игрой мастеров, а не игроков верхнего уровня. Мастера явно слабее, чем игроки верхнего уровня, а игрок мирового класса, такой как Ли Седол, должен уметь использовать это относительно низкое знание. Тем не менее, AlphaGo также учится на собственной игре. В какой степени это компенсирует тип игр, используемых для обучения, неизвестно и вполне может быть решающим фактором в матче.

Несмотря на превосходное распознавание образов, которое часто считается отличительной чертой человеческого опыта (Gobet, 2015), AlphaGo слабее, когда дело доходит до поиска вперед. Это связано с тем, что способ, которым он выполняет поиск, является статистическим, а также проверяет критические линии. В этом отношении это противоположность Deep Blue, которая была оптимизирована для точного поиска. Ли Седол может воспользоваться этим, выбирая позиции, содержащие тактические вариации, где решение зависит от нескольких критических ходов. Статистический поиск AlphaGo может пропустить эти тонкости и идти за линиями, которые поддерживаются подавляющим большинством ходов, но опровергаются одним движением.

Для Ли Седола дилемма будет заключаться в том, должен ли он играть так же, как против людей, или изменить свой стиль, чтобы надеяться воспользоваться слабостями AlphaGo. Существует опасность для последнего. Исследования в шахматах показали, что игроки, играя за пределами стиля, в котором они специализируются, выступают на более слабом уровне (Bilalić, McLeod, & Gobet, 2009). Этот вывод, вероятно, применим и к Go. Кроме того, пытаясь предвидеть способ мышления AlphaGo, будут задействованы познавательные ресурсы, которые тогда не используются для игры.

Несмотря на огромные вычислительные способности AlphaGo и его замечательные способности распознавания образов, Ли Седол имеет гораздо более глубокое понимание игры. Таким образом, учитывая неопределенность в отношении реальной силы AlphaGo, наш совет для него – начать матч, сыграв ту игру, в которой он обычно превосходит. Только если все становится кислым, если он попытается применить методы, направленные на непосредственное использование преимуществ AlphaGo (предполагаемых).

Фернан Гобет и Морган Эреку

Рекомендации

Bilalić, M., McLeod, P., & Gobet, F. (2009). Специализированный эффект и его влияние на память и решение проблем у опытных шахматистов. Когнитивная наука, 33 , 1117-1143.

Chib, V., Shimojo, S., & and O'doherty, J. (2014). Влияние стимулирования на снижение производительности для крупных денежных результатов: поведенческие и нейронные механизмы. Journal of Neuroscience, 34 , 14833-14844.

Gobet, F. (2015). Понимание опыта: многодисциплинарный подход . Лондон: Палгрейв.

Hsu, F.-H. (2002). За Deep Blue: создание компьютера, победившего чемпиона мира по шахматам . Принстон, Нью-Джерси: Принстонский университет.