AlphaGo対李世ドル

出典: フリー百科事典『ウィキペディア(Wikipedia)』

AlphaGo対李世乭(アルファご・たい・イ・セドル)は、韓国プロ棋士である李世乭と、Google DeepMindが開発したコンピュータ囲碁プログラムAlphaGoの五番勝負である。

対局はコミ7目半の中国ルールで、持ち時間は2時間で、切れると1手1分の秒読み、ただし1分単位で合計3回の考慮時間がある[1]

勝者(勝ち越し者)は100万米ドルの賞金を得る。もしAlphaGoが勝利すれば、賞金はUNICEFを含むチャリティーへ寄付される[2]。賞金に加えて、李世乭は全5戦の対局料として15万米ドル、1勝につき2万米ドルを得る[1]

概要[編集]

囲碁は長い間、AIの分野における難問と見なされており、チェス将棋でコンピュータがプロ相手に勝利を収めているなか、2015年の時点でもプロ棋士の棋力には遠く及ばず、AlphaGo以外の囲碁プログラムは3子のハンディキャップを貰った置き碁でも勝ったことがなかった。しかし2015年10月、AlphaGoヨーロッパ碁コングレスで優勝経験のあるプロ棋士である樊麾と非公開の五番勝負を行い、5勝0敗で破っていた。

そして2016年、今度はトッププロ棋士との対局を企画されたのがこの対戦である。

対局の模様は中国語、日本語、朝鮮語、英語の解説付きでライブ配信された。朝鮮語の配信はBaduk TVを通じて行われた[3]。英語のオンライン配信はマイケル・レドモンドアメリカ囲碁協会副会長のChris Garlockによって行われ、平均視聴者は8万人、第1局の終局近くには視聴者が10万人に達し、古力柯潔が解説を行った中国語での第1局の配信はテンセントLeEcoによって提供され、視聴者は約6千万人に達する[4]など大いに注目を集めた[5]

この対局は1997年に行われたディープ・ブルーとガルリ・カスパロフとの間の歴史的なチェス対局と比較されている。

対局者[編集]

AlphaGoはGoogle DeepMindによって開発された、囲碁を打つためのコンピュータプログラムである。AlphaGoのアルゴリズムは機械学習モンテカルロ木探索の組み合わせを用いており、人間の棋譜による教師あり学習と、自己対戦による強化の組み合わせで成り立っている。まずAlphaGoは、ネット対局場KGSの6段以上のアマ高段者の棋譜約16万局、約3000万手を教師にして[6][7]人間の打つ手を模倣できるように訓練され[8]、実際に打たれた手を57%の確率で模倣できるようになった[9]。次に旧バージョンのAlphaGo自身と考慮時間が極端に短い対局を繰り返す強化学習を行った[10]。その結果、他の囲碁プログラムと500戦し499勝を収めるまでの棋力に至った[9]

李との対局に使用されるAlphaGoのバージョンは、樊麾との対局と同等のコンピュータパワー(1,202 CPU、176 GPU)を使う[11]。システムは着手の「データベース」は活用しない。AlphaGoの作成者の一人は次のように説明した[12]

我々はAlphaGoに囲碁を打つようプログラムしたが、どんな手を思い付くのかは全く分からない。AlphaGoの手は訓練からの創発現象である。我々は単にデータセットと訓練アルゴリズムを作成しただけだ。しかし、AlphaGoが思い付く手は我々の手を離れており — そして碁打ちとして我々が思い付くものよりもずっと優れている。
李世乭(2012年)

李世乭韓国棋院に所属する[13]。1996年に12歳でプロに昇段し、それ以降に18回の世界王者となっている[14]。李は出身の韓国において「国民的英雄」と呼ばれており、型にはまらない創造的なプレーでも知られている[15]。李世乭は当初AlphaGoを「大勝」で破るだろうと予測した[15]。対局の数週間前、李は韓国の名人戦で勝利した[15]

ルール[編集]

対局は五番勝負で行われ、賞金は100万米ドルである[2]。中国ルールでコミは7目半。持ち時間は2時間で切れると1手1分の秒読み、ただし1分単位で合計3回の考慮時間がある[1]。対局は3月9日から15日までの1週間で行われ、13時(日本・韓国標準時)から始まる[16]

対局[編集]

この対局は韓国ソウルフォーシーズンズホテル2016年3月に行われ、ライブでストリーミング配信される[17][18][19]。DeepMindチームのメンバーでアマチュア6段の黄士傑 がAlphaGoの代わりに盤面に着手する。AlphaGoはアメリカ合衆国に位置するサーバを使ったGoogleのクラウドコンピューティングによって動作する[20]

概要[編集]

対局
日付 黒番 白番 結果 手数
第1局 2016年3月9日 李世乭 AlphaGo AlphaGo中押し勝ち 186
第2局 2016年3月10日 AlphaGo 李世乭 AlphaGo中押し勝ち 211
第3局 2016年3月12日 李世乭 AlphaGo AlphaGo中押し勝ち 176
第4局 2016年3月13日 AlphaGo 李世乭 李世乭中押し勝ち 180
第5局 2016年3月15日 李世乭 AlphaGo AlphaGo中押し勝ち 280
結果:
AlphaGo 4 – 1 李世乭

第1局[編集]

AlphaGo(白)が第1局を勝利した。李は一局の大半を通して主導権を握っているように見えたが、AlphaGoが最後の20分に優位に立ち、李が投了した[21]。李は終局後に、序盤に大きなミスを犯したと述べた。李は、序盤におけるコンピュータの戦略は「卓越」しており、AlphaGoは人間の棋士なら打たないような手を打ったと述べた[21]。GoGameGuruでこの対局を解説したDavid Ormerodは、李の黒7を「序盤でAlphaGoの実力を試す奇妙な手」と説明した。この手を疑問手と見なし、AlphaGoの応手を「正確かつ効果的」と見なした。Ormerodは序盤はAlphaGoがリードし、李は黒81から挽回を始めたが、黒119と黒123が疑問手であり、黒129が敗着になったと説明した[22]。韓国棋院の趙漢乗は、AlphaGoの打ち回しは2015年10月に樊麾を破った時よりも大きく改善されていたと論評した[22]。プロ囲碁棋士マイケル・レドモンドは、コンピュータの打ち方は樊との対局時よりも積極的であったと述べた[23]

金成龍によれば、李世乭は102手目のAlphaGoの強手に驚かされたようである[24](この手の後に李は10分以上長考した)[24]

99手目まで
100-186手目

第2局[編集]

AlphaGo(黒)が第2局に勝利した。李は対局後に、「AlphaGoはほぼ完璧な碁を打った」[25]、「序盤から自分がリードしたと一度も感じなかった」と述べた[26]

AlphaGoの作成者の一人デミス・ハサビスは、解説者がどちらが優勢か判断できなかったゲームの中盤からAlphaGoが勝利を確信していたと述べた[26]。AlphaGoの打った37手目、四線の石に対する肩ツキはそれまでの囲碁の常識にはなかった手で、見守っていた人々を驚愕させ、「新たなパラダイムを示した」と評された[27]。韓国棋院の安永吉英語版は、特にAlphaGoの黒151、157、159を賞賛した[28]

黒167は李に紛れを求めるチャンスを与えたようにも見え、ほとんどの解説者は悪手だと断言した。しかし、のちにこの手も多少の損の代わりに勝利を確実なものにするための正しい判断だったと考えられるようになった[28]

99手目まで
100-199手目
200-211手目

第3局[編集]

AlphaGo(白)が第3局に勝利した[29]

第2局の後、棋士の間では、AlphaGoの真の実力について、まだ強い疑いがあった。第3局ではこの疑いが晴れた。Ormerodは以下のように論評した。

AlphaGoは、経験を積んだ棋士たちが抱くその強さに対する疑いを全て晴らすように、文句の付けようのない形で勝利した。AlphaGoは恐ろしさを覚えるほど非常にうまく打ちまわした ... 李はAlphaGoに非常に厳しく一方的な攻めを見せたが、結果的にこれまで気付かれていなかったAlphaGoの真の力を明らかにしてしまった ... 李は攻めによる得を得ることができなかった ... 最高の中盤戦の名人である彼が、はっきり明確にお株を奪われたのだ[30]

安永吉とOrmerodは、この一局は「AlphaGoが全ての人間の棋士よりも単純に強い」[30]ことを示したとした。AlphaGoは今までの2局では現れなかった、コンピュータには判断が難しいとされてきたコウでもミスは犯さなかった[31]。安とOrmerodは、白148が特に注目に値すると考えた。複雑なコウ争いが起きているなか、AlphaGoはコウ争いに勝てると自信を見せ、上辺の大場に先着したのである[30]

黒番の李は高中国流を採用したが、AlphaGoは白12と黒の大模様に打ち込んでいった。李としてはこの白を厳しく攻めて得を図りたいところだったが、AlphaGoに簡単にサバかれてしまった[30]。安は李の黒31が敗着であった可能性が高いとしており[30]アメリカ囲碁協会のAndy Jacksonは勝敗が黒35の時点で既に決していたと判断した[32]。AlphaGoは白48から碁の主導権を握り、李は守勢を余儀無くさせた。李は黒77・79と反撃したが、AlphaGoは白90まで局面を簡明にすることに成功した。AlphaGoは下辺に大きな地模様を作り、白102から112まで、右辺や左上の白石の強化に回った。安は一連の進行を「洗練されている」と表現した[30]。李は黒115から下辺の白地を荒らしに行ったが、AlphaGoは適切に対応した。黒131から複雑なコウを仕掛けたが、AlphaGoのミスを誘うことはできず、176手目に投了した[30]

<