AlphaGo

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索
AlphaGo logo
AlphaGo ロゴ

AlphaGoアルファ碁、アルファご)は、Google DeepMindによって開発されたコンピュータ囲碁プログラムである。2015年10月に、人間のプロ囲碁棋士を互先(ハンディキャップなし)で破った初のコンピュータ囲碁プログラムとなった[1][2]

Google Cloud Platformのコンピュータ資源(CPU1202個、GPU176基)を使って学習させている。

2016年3月15日、韓国棋院は、李世乭との五番勝負で3勝(最終的に4勝1敗)を挙げたAlphaGoに名誉九段を授与した。アマチュアに対する名誉段位ではなく、プロとしての名誉段位である[3]

概要[編集]

囲碁と人工知能[編集]

囲碁は創造的、戦略的思考を必要とする複雑なボードゲームであり[4]、長い間、囲碁は、チェスのようなその他のゲームと比較して人間に勝つのがコンピュータにとってはるかに困難であると考えられていた。これは、チェスなどよりも可能な局面の数がはるかに大きいため、力まかせ探索といった伝統的なAI手法にとって極めて困難なためであった[1]

2015年より前は[5]、最良の囲碁プログラムはアマチュアの有段レベルに達するのがやっとであった[6]。小さな9路盤(9×9)ではコンピュータは健闘し、一部のプログラムはプロ棋士に対して9路盤で勝利できるが、標準的な19路盤ではプロ棋士に太刀打ちできていなかった[7]IBMのコンピュータディープ・ブルーがチェス世界チャンピオンガルリ・カスパロフを1997年に破った後、囲碁が人間のアマチュアプレーヤーの強さに達するまでにほぼ20年を要した[8][2][1]人工知能の分野における多くの人々も、囲碁はチェスよりも人間の思考を模倣するためにより多くの要素を必要とすると考えていた[9]

AlphaGoはそれ以前のAIの取り組みとはニューラルネットワークを応用している点において最も大きく異なっている。ニューラルネットワークでは、評価経験則が人間によってハードコードされておらず、代わりにプログラム自身によって自分自身との対局を数千万回繰り返すことによってかなりの程度まで学ぶ。AlphaGoの開発チームでさえ、AlphaGoがどのように石の配置を評価し次の手を選択しているかを指摘することはできない。モンテカルロ木探索英語版もプログラムの推論効率を改善するための主要な方法として用いられている。

AlphaGoは、それ以前の囲碁プログラムから著しい発展を遂げた。その他の利用可能な囲碁プログラムと対局した500局で、AlphaGoは1局しか負けなかった[10]

樊麾との対局[編集]

樊麾対AlphaGo – 第5局

AlphaGoは2015年10月に、ヨーロッパ王者でプロ二段の樊麾英語版を5-0で破った。AIが人間のプロ棋士をハンディキャップなしの19路盤で破ったのはこれが初めてであった[11][12]。一部の解説者は樊麾と李世乭(プロ九段)との間の実力の差を強調した[13]。コンピュータプログラムのZenとCrazy Stone英語版はこれ以前に九段のプロ棋士を4子のハンディキャップ付きで破っていた[14][15]。カナダのAI専門家ジョナサン・シェーファー英語版は、樊との対局後に論評し、AlphaGoを未熟な「神童」と比較して、「プログラム(AlphaGo)が真にトップの棋士と対局した時が本物の成果となるだろう」と考えた。シェーファーは、2016年3月の対局では李が勝利するだろうと考えた[12]。プロ棋士で国際囲碁連盟事務局長の李夏辰英語版は、AIが李に挑戦する見通しに「非常に興奮している」と意見を述べ、両者に等しく勝利する機会があると考えた[12]

囲碁の専門家は樊に対するAlphaGoの打ち手、特に盤全体の意識の欠如に関連した点にミスを見出したが、李との第1局の前は、10月以降にどの程度プログラムが改善されたかは未知であった[16][17]。Google DeepMindのデイヴィッド・シルバーは、AlphaGoは李の以前の棋譜を使って特別に鍛えられてはいないと述べた[18]

プログラムに用いられたアルゴリズム[2]について記述したNature誌に掲載される論文の発表と合わせるために、このニュースの発表は2016年1月27日まで遅れた[19]

李世乭との対局[編集]

AlphaGoは、2016年3月に数多くの世界戦優勝経験のあるプロ棋士李世乭(九段)に挑戦した[20]。結果は、4勝1敗と勝ち越した[20]

新バージョンMaster[編集]

2017年初頭、ネットの囲碁対戦サイトに「Master」を名乗る打ち手が出現、日中韓のトップ棋士を相手に60戦無敗という驚異的な戦績を挙げて話題を集めた。1月5日になり、開発者デミス・ハサビスツイッターにて、MasterはAlphaGoの新バージョンであることを明かした[21]。これらの対戦は非公式なテストであり、2017年内に本格的な公式戦を行なう方針としている。

開発チーム[編集]

AlphaGoについて書かれた原著論文「Mastering the Game of Go with Deep Neural Networks and Tree Search」には以下の20名が著者として名を連ねている。コレスポンディング・オーサー(連絡著者)は筆頭著者のデイビッド・シルバーと最終著者のデミス・ハサビスであるが、論文冒頭に「本研究における各著者の貢献度は等価である」と記されている。Google本社に所属する2名を除く特記無き全員がGoogle Deepmind社の所属である[22]

  • デイビッド・シルバー / David Silver 
  • 黃士傑 / Aja Huang 
  • クリス・J・マディソン / Chris J. Maddison
  • アーサー・ゲズ / Arthur Guez
  • ローレン・シフレ / Laurent Sifre
  • ジョージ・ヴァン・デン・ドリエッシェ / George van den Driessche
  • ユリアン・シュリットヴィーザー / Julian Schrittwieser
  • イオア二ス・アントノグロウ / Ioannis Antonoglou
  • ヴェーダ・パンニールセルヴァム / Veda Panneershelvam
  • マルク・ランクトー / Marc Lanctot
  • サンデル・ディーレマン / Sander Dieleman
  • ドミニク・グレーヴェ / Dominik Grewe
  • ジョン・ニャム / John Nham (Google)
  • ナル・カルヒブレンナー / Nal Kalchbrenner
  • イリヤ・サツケヴァー / Ilya Sutskever (Google)
  • ティモシー・リリクラップ / Timothy Lillicrap
  • マデリーン・リーチ / Madeleine Leach
  • コーライ・カヴァキュオグル / Koray Kavukcuoglu
  • ソーレ・グリーペル / Thore Graepel
  • デミス・ハサビス / Demis Hassabis

アルゴリズム[編集]

AlphaGoは、ディープニューラルネットワークを用いて実装された「value network」と「policy network」によって動くモンテカルロ木探索英語版を用いる[1]。AlphaGoは当初、棋譜に記録された熟練した棋士の手と合致するよう試みることで人間のプレーヤーを模倣するように訓練され、次に、ある程度の能力に達すると、強化学習を用いて自分自身と多数の対戦を行うことでさらに訓練された[1]

ハードウェア[編集]

設定と性能
配置 スレッド検索数 CPU数 GPU数 イロレーティング
単独 40 48 1 2,151
単独 40 48 2 2,738
単独 40 48 4 2,850
単独 40 48 8 2,890
分散処理 12 428 64 2,937
分散処理 24 764 112 3,079
分散処理 40 1,202 176 3,140
分散処理 64 1,920 280 3,168

戦績[編集]

  • vs樊麾 5勝0敗(非公開対局)
日付 結果 先番 相手
2016.3.9 中押し勝ち 李世乭
2016.3.10 中押し勝ち
2016.3.12 中押し勝ち
2016.3.13 中押し負け
2016.3.15 中押し勝ち

※AlphaGoから見た結果

影響[編集]

囲碁は以前は当時のテクノロジーでは力の及ばない機械学習における難問であると見なされていたため、AlphaGoは人工知能研究における画期的な進展として歓迎されている[23][24]。コンピュータ囲碁研究の結果は、認知科学パターン認識機械学習といったその他の同様の分野に応用されている[25]

囲碁が盛んな韓国ではAlphaGoが人間を超え韓国・中国・日本のプロに60連勝するほどの強さになっていることから、囲碁人気が低下していると朝鮮日報に報じられた。「アルファ碁が(プロ棋士に)60連勝してからは、テレビで囲碁の対局は見なくなった」「好手、悪手についてのプロ棋士の解説は信じられない」「人間が何千年もかけて築いてきた囲碁の定石が崩壊した」といった反応があった[26]

天頂の囲碁(Zen)の開発者である尾島陽児は、「人間は人工知能に勝てなくなりますか?」という質問に「アルファ碁(AlphaGo)にはすでに勝てないと思います」と答えており、既にトッププロを凌駕しているという見解を示している。ただし、「対コンピュータの攻略法はあります。ネットで打っている人たちはコンピュータの対応に慣れていて、混乱させる手をたくさん打ってきます。コンピュータは複雑な読みが苦手なので、難しい読みが必要な形をあちこちにいっぱい作るという感じです。」とも述べている[27]

脚注[編集]

  1. ^ a b c d e Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning”. Google Research Blog (2016年1月27日). 2016年1月29日閲覧。
  2. ^ a b c Google achieves AI 'breakthrough' by beating Go champion”. BBC News (2016年1月27日). 2016年1月29日閲覧。
  3. ^ 囲碁AIに「名誉九段」授与=韓国棋院=”. 朝鮮日報 (2016年3月15日). 2016年3月15日閲覧。
  4. ^ “[Breaking AlphaGo victorious once again”]. (2016年3月10日). http://www.koreatimes.co.kr/www/news/tech/2016/03/325_200068.html 2016年3月11日閲覧。 
  5. ^ Silver, David; Huang, Aja; Maddison, Chris; Guez, Arthur; Sifre, Laurent; van den Driessche, George; Schrittwieser, \tJulian; Antonoglou, Ioannis et al. (2016-01-28). “Mastering the game of Go with deep neural networks and tree search”. Nature. http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html. 
  6. ^ Wedd, Nick. “Human-Computer Go Challenges”. computer-go.info. 2011年10月28日閲覧。
  7. ^ 日本棋院が協力する電聖戦では4子から3子のハンディキャップを付けていた
  8. ^ Computer scores big win against humans in ancient game of Go”. CNN (2016年1月28日). 2016年1月28日閲覧。
  9. ^ Johnson, George (1997-07-29), “To Test a Powerful Computer, Play an Ancient Game”, The New York Times, http://query.nytimes.com/gst/fullpage.html?res=9C04EFD6123AF93AA15754C0A961958260 2008年6月16日閲覧。 
  10. ^ Google AlphaGo AI clean sweeps European Go champion”. ZDNet (2016年1月28日). 2016年1月28日閲覧。
  11. ^ Google achieves AI 'breakthrough' by beating Go champion - BBC News” (2016年1月27日). 2016年1月28日閲覧。
  12. ^ a b c Elizabeth Gibney (27 January 2016), “Go players react to computer defeat”, Nature, doi:10.1038/nature.2016.19255, http://www.nature.com/news/go-players-react-to-computer-defeat-1.19255 
  13. ^ AlphaGo defeats Lee Sedol in first game of historic man vs machine match”. Go Game Guru (2016年3月9日). 2016年3月9日閲覧。
  14. ^ Zen computer Go program beats Takemiya Masaki with just 4 stones!”. Go Game Guru. 2016年1月28日閲覧。
  15. ^ 「アマ六段の力。天才かも」囲碁棋士、コンピューターに敗れる 初の公式戦”. MSN Sankei News. 2013年3月27日閲覧。
  16. ^ Dana Mackenzie (9 March 2016). “Update: Why this week’s man-versus-machine Go match doesn't matter (and what does)”. Science. doi:10.1126/science.aaf4152. http://www.sciencemag.org/news/2016/03/update-why-week-s-man-versus-machine-go-match-doesn-t-matter-and-what-does. 
  17. ^ Ben Kloester (2016年3月4日). “Can AlphaGo defeat Lee Sedol?”. Go Game Guru. 2016年3月10日閲覧。
  18. ^ AlphaGo Korean Press Briefing” (2016年1月28日). 2016年3月10日閲覧。
  19. ^ Mastering the game of Go with deep neural networks and tree search”. Nature (2016年1月28日). 2016年1月28日閲覧。
  20. ^ a b “アルファ碁、最終局も制す 最強・李九段に4勝1敗”. 朝日新聞. (2016年3月15日). http://www.asahi.com/articles/ASJ3H61JGJ3HUHBI02K.html 2016年3月15日閲覧。 
  21. ^ https://twitter.com/demishassabis/status/816660463282954240
  22. ^ Mastering the Game of Go with Deep Neural Networks and Tree Search 2016年7月1日閲覧
  23. ^ Connor, Steve (2016年1月27日). “A computer has beaten a professional at the world's most complex board game” (en-GB). 2016年1月28日閲覧。
  24. ^ Google's AI beats human champion at Go” (2016年1月27日). 2016年1月28日閲覧。
  25. ^ Müller, Martin. Computer Go, Artificial Intelligence 134 (2002): p150
  26. ^ チョン・ヒョンソク (2017年3月12日). “原因は「アルファ碁」!?韓国で囲碁人気失速”. 朝鮮日報. 2017年3月14日閲覧。
  27. ^ コンピュータはより人間らしくなった!?「天頂の囲碁」ソフト開発者インタビュー”. ニュースウォーカー (2016年7月14日). 2017年4月23日閲覧。

関連項目[編集]

外部リンク[編集]