世界最強クラスのイ・セドルに勝った人工知能(1)
Written by admin on 2016年3月20日 – 12:00
こんにちは、吉田繁治です。2週間、配信をしなかったことをお詫 びします。義務がある有料版と違い、無料版に対しては「明日書こ う」とする甘えがあります。書くことは、構想を練るのではなく、 まず書かねば始まらない。経験から、「書き始めることが書くコツ だ」と分かっているのですが、甘えが生じます。 今回は、人間の「知識と経験」にかかわる重大なテーマ、人工知能 の現在です。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ <Vol.354:世界最強クラスのイ・セドルに勝った人工知能(1)> 2016年3月20日:無料版 【目次】 1.概論 2. 将棋と囲碁のソフトから 3.ディープ・ラーニングまで 4.ディープ・ラーンニングというイノベーション 5.多重回帰分析 6.グーグルが作ったアルファ碁は、自己学習する ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ ■1.概論 【機械学習】 2006年以降、「機械学習」するソフトが開発され、人工知能と言え る段階に来ているからです。現在のコンピュータのように、人間が コンピュータにプログラムを与えデータを入力して、結果を出すの ではない。 コンピュータ自身が、ある分野の過去のデータを大量に吸収し(ビ ッグデータ)、自動解析して、回帰分析の変数を決め、結果を出し ます。そしてさらに、次のデータから自己成長して行くのです。 【回帰分析】 回帰分析のうち、単回帰分析は関連のあるデータを分析して、Y (従属変数)=a(係数)×独立変数+定数の、回帰数式で表すもの です。重回帰分析では独立変数が2つ以上になります。男性の体重 (Y)は、新身長×a+胸囲×b+Cのように記述できます。 マンションの価格は、床面積×a+階数×b+駅からの距離×c+ 人口密度×c+環境評価×d+E等の、重回帰分析で示せるでしょ う。機械学習では、この回帰分析の式を自動で作って、独立変数か ら予測するのです。 【自己成長する人工知能】 人間のように、試行錯誤の経験をデータベース化して、機械学習で 成功の原則を導き出して、人や動物の脳のように成長していくコン ピュータになってきたのです。 この点で、人間が与えたプログラムに従ってしか計算しないという 限界をもつ、今までのコンピュータとは一線を画します。ただし、 このディープ・ラーンニングという方法も開発後まだ10年であるた め、ごく一部の人にしか知られていません。 【まだ50名しかいない】 一線級のシステムエンジニアは、世界でも50人しかいず、グーグル、 フェースブック、アップル、IBMなどから奪い合いという。年俸数 億円(数百万ドル)のプレーヤーも多い。 今後、巨大な利益を生むビジネスの可能性があるからです。いや可 能性ではない。このまま進化し、適用範囲が広がれば、ほぼ100% 確実です。 情報の大きな蓄積(ビッグデータ)から、自分で学習(ディープ・ ラーニングという)でき、能力を成長させることから「人工知能」 と言えるものになってきたのです。 【自動運転やドローン】 2022年ころには実用化される見込みの自動運転も、人工知能です。 飛行ロボットである「ドローン」にも、伝書鳩のように、障害物の 瞬間認識ができる人工知能ソフトを組みこめば、目的スポットへの 自動配送ができます。 医薬品などの軽いものは、病院へのドローンでの配送が有効です。 障害を避けるプログラムは、人間が与えるのではなく、学習で自己 生成できることが驚きです。 【試行の評価:教師ソフト】 人の脳が、練習つまり試行錯誤から学習するのと同じです。 Aはよくできた、Bはダメというように評価しておくと、試行の中で 成功体験を積み重ね、確率的にもっともいい方法を見つけるのです。 将棋や囲碁のソフトが指す手と同じです。 【お掃除ロボット】 すでに普及している掃除機のロボットの「ルンバ(商品名:米国ア イロボット社)」は、センサーをもち、壁などの障害に軽くぶつか ると、自分で方向を変えます。階段も避けます。低い障害は、戦車 のようなキャタピラーを出して乗り越えます。ただし「経験」を蓄 積して解析する機能は実装していません。このため、毎回同じよう にぶつかって間違えます。 しかし、ディープ・ラーニング型の人工知能は、試行錯誤と成功を 学習(これがラーニング)して、階層化したデータベースに大量に 蓄積(これがディープ)し、成功する動きを原則化するのです。 初めての部屋でも壁に一回もぶつからず、もっとも効率的な動きで 掃除ができるようになります。 クリーニング店で、洗ってアイロンをかけたシャツを個別に認識し、 きれいにたたむというロボットもできるはずです。ルンバでは、認 識センターをつければ床に落ちた「ダイアモンドを見つけました」 と知らせるようにすることもできます。 (注)新しい発想の家電、ルンバの開発には1997年から10年を要し たという。液晶パネルのあと、シャープが、今後は巨大市場になる 人工知能つきの家電や産業用機械を研究・開発をしていたら、台湾 の鴻海(ホンファイ)精密工業に買収されるような事態にはならな かったかもしれません。ソニーも同じです。 【応用分野は広い】 医療での診断や治療での、医師の助手としても応用できます。パ ターン化できるレントゲン画像の診断など、もっとも得意でしょう。 世界の病院には、過去の診断画像の大量の蓄積があるので、それを 学習させておけばいい。 ロボットによる、高度な職人の自動加工ももちろんです。労働人口 減から、経済が長期停滞(Secular Stagnation)している時代に、 この人工知能で太い光が差してきました。 2025年ころから、人工知能を実装した機械は開発の爆発期を迎える でしょう。ハードのメモリは1T(1兆)バイトでも、指先大に極小 化し、安価になるからです。 創造性が要求される作曲(オペラなど)でも、人工知能が作ったも のと人間が作ったものの、区別ができないレベルにまで来ています。 【インダストリー4.0】 18世紀の英国での蒸気機関、米国での石油エネルギーと量産の革 命、に続いて、それに続くエレクトロニクス革命に続き、におそら く、今後10年か20年の間に人工知能が、第4次の産業革命にな っていくでしょう。それくらい進歩が速い。ドイツでは、インダス トリー4.0として、官民共同での研究が政府予算で進められていま す。 流通と販売の在庫管理なども、売上数予想を多変量解析で行えば、 お手のものになって行きます。 【ディープ・ラーニング】 技術の核は、本稿で解説する「ディープ・ラーンニング」です。 科学者の間では2045年には、人間の脳の能力はるか超える、用途が 限定されない汎用人工知能の時代になると想定されています。 クラウドに接続されたノートブックが、音声での命令で仕事を行っ てくれるイメージです。アラジンの、魔法のランプで出てくる巨人 を、個々人が持つことができる感じと言えば、わかりやすいでしょ うか。 多くの、定型化された商品は人工知能化したロボットが作ることが できるので、働く人は時々画面をにらみ(ロボットをモニターし て)、コントロールだけをしておけばいいことになるでしょう。 (注)微細な手の技術でもある医療や名人的な調理などは人間が行 うでしょう。 【人口減の時代の希望】 少子高齢化と人口減に、欧州より10年から20年早く直面している日 本にとって、大きな希望が見えてきたのです。 豊かさが、資本主義での金銭的な所得に依存しない社会でしょう。 経済的な豊かさとは、商品とサービスを買うことができる量です。 その商品とサービスが格安になるからです。実は、インターネット 検索エンジンのグーグルが、最先端に位置しています。 ■2. 将棋と囲碁のソフトから 人工知能の働きを理解するため、2007年以降は人口知能になってい る将棋と囲碁のソフトから、見てゆきます。 2012年の1月14日、日本将棋連盟の前会長 米長邦雄永世棋聖が、将 棋ソフトの「ボンクラーズ」と対戦して敗れました。グーグルの Youtubeに動画が残っています。 【ボナンサとボンクラーズ】 ボンクラーズは、ボナンザに勝てるソフトという意味です。2007年 にカナダ在住の、コンピュータ技術者保木氏によって開発された初 めての人工知能型ソフトと言えるのが「ボナンザ(原義は金鉱)」 です。ボナンザはプロが対戦した6万局の棋譜を、ディープ・ラー ニングの方法でデータベース化し、多変量解析を行って、成功する 手を数値で評価する機能(評価関数という)をもつものでした。 https://www.youtube.com/watch?v=6vUYUr592do 【3回の電王戦(団体戦)】 そのすぐ後、前立腺ガンにかかった米長会長は、髪が落ちた頭で、 後輩に向かい「おーぃ、みんなぁ、ガンバレよぅ」という言葉とと もに、コンピュータとプロ棋士5人の団体戦である「電王戦」を遺 しました。 5人の団体戦だった電王戦は2013年から3月末に3回行われ、最初は コンピュータの3勝1敗1分け、2回目は4勝1敗でした。2013年の初戦 で佐藤慎一五段が男性の現役プロとして初めて負けたときの悲壮な 姿に、解説のアシスタントだった女流棋士、山口恵梨子初段が泣き、 会場からもすすり泣きが聞こえました。 2015年3月のファイナル・マッチではプロ側の2勝3敗でした。この 第三戦では、普通にさしていては負けると、追い詰められたプロ側 がソフトのバグやクセを探す感じがあって、前2回の興奮と面白さ は欠けていました。このためもあり「にこにこ動画」のドワンゴが 主催していた電王戦は終了したのです。 【今年は叡王戦】 今年は、最強と目される2人、羽生名人(4冠)と渡辺竜王を除い て、ほぼ全プロ棋士が参加したリーグ戦を勝ち上がった山崎隆之八 段が、「叡王戦」として、2戦を戦います(16年4月)。 相手は、山本一成氏が磨き上げ、コンピュータ戦で優勝し、現在最 強と言われる、ディープ・ラーニングをもつ人工知能型の「ポナン ザ」です。プロ棋士の予想では「プロの2敗」が多い。楽しみです。 「にこにこ動画」では、コンピュータゲームは行っても、将棋はま るで知らない人の観戦も多い(1/5くらいか)。何が興味を惹くの か。コンピュータに勝つのを、人間の立場で見たいのです。 2回と3回目の電王戦(団体戦)では、6か月間くらいの貸出期間に、 研究として1000局くらいを早指した棋士は、勝率は10%以下だった と言います(2ちゃんねる情報)。 【コンピュータ側の機能の制限】 CPUをつなぐ「クラスター」は組ませず、貸与期間のソフトの更新 も禁止というルールでした。トップクラスの棋士でも勝率はよくな い。ソフト制作者は、「コンピュータはもう羽生さんも超えていま すよ」と言う。 (注)クラスター:同じCPUを例えば500台つなげば、その実行速度 は、〔およそ√500倍=22倍〕に上がるという。 【囲碁の名人との対決】 先週驚いたのは、グーグルが700億円で買収したという子会社(英 国ディープ・マインド社:人工知能プログラマー50名)が作った 「アルファ碁」の登場です。 【お化けのようなクラスター】 ディープ・ラーニングを使うアルファ碁のハードは、すさまじい。 ネットワークを介したクラウドでCPUを1202個つなぎ、行列計算の 並列処理ができるGPU(画像処理ユニット)を172個使い、1000代の サーバーを活用しているという。データの処理速度はスーパー・コ ンピュータの更に上の性能でしょう。お化けのようなマシンです。 先週末から火曜日まで、史上最強の5人の棋士の1人と言われる イ・セドル氏が5戦しています。世紀の天才(韓国のレーティング は現在も世界1)とも言われていたセドル氏は1勝4敗でした。 当方、囲碁はまるで知りません。教えてもらったアマの有段者に、 9子の井目でコロコロ負けます。ルールをかじった程度です。 「人工知能ソフトがトップの囲碁棋士に、完璧な布石で勝った」と いうニュースから興味を惹かれ、youtubeで後半の実況を見ました。 盤面だけでは、どちらが優勢か当方には判断できません。(注)将 棋は少しですが、わかります。囲碁では、プロ棋士の解説を注意深 く聞き、あぁそうかと知る程度でしかない。 ディープ・ラーンング、モンテカルロ法、そして水平戦効果という 固有の用語が出てきます。その言葉にも、のめりこんだのです。後 半3戦を、続けて見ました。もちろん、全部、解説入りです。 【検索型ツリーの分岐数は有限であっても無限に近い】 将棋では、局面数(駒の配置の種類)が、10の120乗と言われます。 有効なものになると「10の70乗」くらい。ゼロが70個、つまり70桁 の数字です。と言っても想像がつかない。 宇宙に存在する原子の数を計算すると10の80乗個という。その、 10の10乗(10,000,000,000=100億)分の1です。無限ではありませ んが、途方もない局面数です。 囲碁は、将棋よりはるかに広い。有効な局面数は、「10の172乗の 1.74倍」とされています。宇宙の原子数よりはるかに多い。これは、 総当たりの計算では、最強のソフトを作るのは不可能なことを示し ています。 【囲碁】 この局面の広さのため、将棋ソフトでは2015年に名人クラスを超え たかもしれないが、囲碁では10年先とされていました。ところが突 然、世界の第一人者のイ・セドル氏を、ほぼ完膚なきまでと言える レベルで、破りったのです。 ところがセドル氏は、今は、1勝4敗でも「とてもよくやった。1勝 した。」と称賛されています。アルファ碁がトッププロも及びもつ かない強さを見せたからです。神の手と言われるくらいでした。一 体何が起こったのか。 セドル氏は戦いの直前、「5戦全部に勝てる」という強い自信を見 せていました。どちらかが3戦続けて負けても5戦全部を戦うという 条件で、グーグルからの賞金100万ドル(1億1000万円)が賭かって いました。 現在のタイトルでの世界1は、中国の18歳の天才少年 カケツ氏です。 カケツ氏は、負けるかもしれないが、ぜひ「アルファ碁」と戦いた いと表明しています。 ■3.ディープ・ラーニングまで 【初期の探索型】 将棋の盤面は〔9×9=81個〕のマス目からなります。駒の位置が1 個ずつですから、理論的に可能性のある手は80種とみることができ ます。ここでは有効な手は無視しています。 初歩の力では「3手の読み」が必要と言われます。自分が指す。そ れに対して相手が指す。次は自分が指すと3手です。この3手後の、 全部の駒の配置である局面数は、〔初手80種×相手の手80種×自分 の80種=80の3乗=51万2000種〕になります。4手目なら、さら にその80倍です(4096万局面と急に大きくなる)。5手目はさらに 80倍ですから、32億7680局面にもなります。 初期のソフトは、手を指した後の局面で、定跡からプログラムをす る人が有効とするものを選択させていました。この場合、コンピ ュータの棋力は、プログラマーの評価能力に依存します。 プロの棋士は、定跡の記憶数と、経験にもよりますが、20手くらい 先の局面を、記憶している「パターン」から読むことができるとさ れています。ある局面を見たとき。お互いが最善手を指したあとの 20手後くらいが、盤面の映像的なイメージとして浮かぶということ です。 あるとき、史上最強とされる羽生名人のTV解説を聞いて、びっくり したことがあります。「この局面は、2002年に、AさんとBさんが、 棋王戦で指したものと同じです。このあとAさんは、こんな手を指 して、結果はこうなりました」 羽生善治名人の頭脳には、プロ棋士の数万局が、ほぼ完全に記憶さ れているのかもしれません。そのデータベースの上で、有効な手に 絞った探索型で次の手を20手くらい読んでいるのでしょう。 このプロ棋士に対して、有効さを評価できないランダムな数手の分 岐を探索する初期ソフトは、はるかに弱いものでした。アマの初段 くらいの腕しかなかったのです。記憶した少ない定跡のデータベー スにはない不利な局面になると、自滅的な手も指していたのです。 探索型では、10手先を読むのも、〔80の10乗≒1に0が19個つく数字 〕なって、どんなに高速のコンピュータでも読めないからです。1 億は、ゼロが8個です。1億の1億倍(0が16個)のさらに100倍とい う局面数になってしますからです。 ■4.ディープ・ラーンニングというイノベーション 保木邦彦氏はカナダ在住の、情報処理の科学者でした(現在、電気 通信大学准教授)。保木氏が2005年に作った将棋ソフト(ボナン ザ)は、当時の最新手法である「ビッグデータのディープ・ラーン ニング」から、局面の評価をする、画期的手法のものでした。 保木氏自身は将棋が強くない。このためプロのようには局面の評価 ができない。しかしインターネットとCD-ROMで、プロ棋士が指した 6万の棋戦での駒の動きが公開されています。近年、20代前半のプ ロ棋士がタイトルをとることも増えているのは、過去6万の棋戦の データベースを、誰でもパソコンで検索して「追経験」できるから です。 保木氏はCD=ROMでデータベースを全部取り込んで、ボナンザのデ ィープ・ラーンニングの方法で、階層型のデータベースにしました。 棋戦は最終的な勝敗がわかっていますから、勝った側の手が有効で す。 ここからが統計学です。コンピュータがデータ処理できるようにす るには、有利さ不利さを感覚ではなく、数値化せねばなりません。 それが「評価関数」ですが、どうやって評価関数を作ったのか? ここからが統計学の方法です。もっとも基本的な、次の手の予測法 から言います。 「最小二乗法」という予測方法があります。データの散布図を作っ たとき、その散布図から予測するときも使われています。例えば、 横のX軸に身長(cm)を、縦のY軸に体重(Kg)を散布グラフにす ることから始まります。 (注)参考の図 http://ocw.nagoya-u.jp/files/71/nizyo1.pdf エクセルに組み込まれたSLOPE関数で直線の傾き(下の式のa)を求 め、INTERCEPT関数で、切片(b)を求めることができます。エク セルにデータを入れて、計算させたとき、男性のあるグループで以 下の結果が出たとします。SLOPE=0.4、切片=7kg 【単回帰分析】 この場合、単回帰の算式は以下になります。 Y=a(0.4)×身長+b(7) この式は、身長が例えば170cmなら、平均体重は0.4×170+7= 75Kgになるであることを示します。160cmなら160×0.4+7=71kが、 そのグループの平均体重です。これは、サンプル数を増やせば、よ り正確な結果を出します。 また男性の体重は、身長のほかには胸囲とも強く関係します。胸囲 を入れると、より正確な平均値が出ます。式は以下になります。 SLOPEの変数がaとbの2になりました。SLOPEの変数が1個のときを、 「単回帰分析」、複数のときを、「重回帰分析」または「多変量分 析」と言っています。 【重回帰分析】 Y=a×身長+b×胸囲+c 身長と胸囲以外に、例えば、失礼なのであまり計られることがない 臀部の大きさをいれれば、平均体重はもっと正確に予測できるでし ょう。 Y=a×身長+b×胸囲+c×臀部の周囲+d この式では、Y(平均体重)は、身長と胸囲と臀部の太さで決まるの で、Yを従属変数といい、身長、胸囲、臀部の周囲を独立変数と言 います。 理論経済のGDPの予測では、変数を多く使う多重回帰分析(多変量 解析)が多用されています。 コンビニや食品スーパーの、日次補充が必要な生鮮、お弁当、総菜 の売上げ数の予想も来店客数、天候、価格、競合状況、見かけ、味 等の変数で多変量解析すれば、確度の高い予測ができる可能性もあ ります。今は、売上予想が難しいのでコストをかけて、1日3回の店 内補充や配送を行っています。 (注)食品スーパーでは、値引き販売と廃棄率が約10%です。回転 寿司が皿のセンサーでハイテク化したように、この分野にも在庫管 理のハイテクロジーが必要です。 ■5.多重回帰分析 この多重回帰解析(多変量解析)の自動化こそが、実はディープ・ ラーンニングです。 人間の手による多変量解析では、独立変数(特徴量ともいう)は人 が決めています。これには限界があり、たとえば特徴量が10種もあ れば、その、イメージと全体計算が不可能な計算量になって行きま す。 ところがディープ・ラーンニングの手法では、コンピュータに、過 去のデータの自動計算を行わせ、独立変数(特徴量)を数万種であ っても自動生成ができるようになってきたのです。このディープ・ ラーンニングこそが人工知能のイノベーションの核心部です。 <膨大なデータ(ビッグデータ)→吸収して自動解析→関連分析を して、多重回帰分析の式をコンピュータが自動で作る→入力された データに対して予測数を出す>・・・これが、現在の人類が達して いる人工知能です。 ▼ボナンザのメソッド 保木氏が設計したボナンザは、まず、プロ棋士の6万戦のデータ ベースから、局面の評価関数を、重回帰分析の方法で自動生成させ たのです。コンピュータが作った独立変数(特徴量)は、数万種に 及ぶといいます。人間の知力では、解析はできません。 評価関数=特徴量1+特徴量2+特徴量3・・・・・特徴量1万 例えば50手目の中盤で、理論上の有効な手が10種あったとします。 ボナンザは、この10種の全部の有効度を示す評価関数を、5分くら いかけて計算します。その上でもっとも評価が高い手を推奨するの です。 画面を見て駒を操作する人には、手の意味が分からない。しかしプ ロの棋士に勝つことができるレベルに達したのです。 2007年に、羽生さんとともに2強とされる渡辺竜王が、コンピュー タ棋戦に初出場で優勝したボナンザと対戦しかろうじて勝っていま す。当人の感想では、「いやぁ、コンピュータは強い・・・」でし た。次回は負けると思ったかもしれません。 保木氏のディープ・ラーンングの方法は無料で公開されたため、そ の後、基本部分をボナンザ式にしたソフトが大量につくられるよう になりました。 そのひとつが現在最強の「ポナンザ」です。ポスト・ボナンザ(後 ポナンザ)の意味でしょう。HEROsというスマホの音声認識などの 人工知能ソフトを作っている会社の社員、山本一成氏が会社を休み、 余暇に作ったものです。 iPhoneなどで、執事(シツジ)が、人間の要求に答えるときの音声 認識(パターン認識)も、試行錯誤させたディープ・ラーンングの 方法を使って、人が発する音声を、確率的に認識しています(ペイ ズ確率を使う)。 「明日の天気は?」と会話帳で言うと、インターネットのデータ ベースを検索し、「晴れです」と答えてくれますね。 ポナンザはまだ、プロ棋士に負けたことがありません。16年4月に は、プロ棋士の「叡王戦」を勝ち上がった山崎八段が、名人戦のよ うな2日制で対戦します。とても楽しみにしています。 ▼検索ツリーの枝刈り ボナンザは、プロの過去の大量の棋譜から学習し、各局面で有利な 手をほぼ10種に絞り、ほぼ20手先までを、探索型で検索していると いう。 しかし15手先の局面数でも、〔10の15乗=1億の1000万倍〕もあり ます。このため重大な局面で許される1手数十分の持ち時間では計 算ができない。 1秒に1億局面を計算できても、1000万秒(115日)かかるからです。 4月後に1手指すコンピュータではゲームにならない。不定形な階 段(将棋で言えば初めての局面)の前で、うんうんうなって、115 日間も固まる不気味なロボットになってしまいます。 このため、人間の手で分岐ツリーの枝を刈る「枝刈り」を行ってい ます。例えば平均で10手のうち有効性が劣る6手の枝刈りを行えば、 〔10手先=4の10乗=105万局面〕に減ります。これなら、パソコン でも瞬間に計算できます。 しかし4手の枝刈りなら、〔10手先=6の10乗=6046万局面〕に増え ます。このため60倍の時間がかかるのです。 どの程度の枝刈りをするか。この感覚的な塩梅(あんばい)が、ソ フトを作る人の棋風になり、限界にもなっています。山本氏の言葉 では、分岐の手を刈りすぎると弱くなる。しかし刈らないともち時 間内に計算できない。1手分刈るかどうか。ここが工夫ですという。 グーグルのように、クラウドでコンピュータを千台もつなげば、処 理速度は〔ほぼ√1000倍=32倍〕に上がりますが・・・CPUを1000 台つなぐクラスターでも、処理速度は32倍です。ハードを1000台並 列につないでも、入力から出力までのスループットの速度は1000倍 にはならないのです。 ■6.グーグルが作ったアルファ碁は、自己学習する 人工知能ソフトで先端を走る経営方針のグーグルは、豊富な資金力 を背景に、2010年に設立された英国ディープ・マインド社を700億 円で買収しました(2014年)。人工知能の一線級の技術者は12名と いう。 このディープ・マインド社がイ・セドルと戦って4勝1敗だった 「アルファ碁」のソフトを作ったのです(2015年)。 囲碁では〔19×19=361マス〕があります。81マスしかない将棋よ り、はるかに分岐が多く、ランダム計算するコンピュータにとって 難しい。このため、前述のように将棋ではトッププロを2015年に超 えても、碁では、10年はかかるとされていました。 プロ同志の棋戦を元にすれば、原理的には、プロを超えることはで きない。対戦するプロ棋士が、間違えた手を打つことや、読みを間 違えることによって勝つことはできても、完全に打ったときは、同 格になります。 「アルファ碁」の特徴は、ソフトの中で自己対戦をして、その棋譜 データを学習し、蓄積してそこからディープ・ラーニングすること です。ルールと序盤の定石を教えられたあと、自己対戦し、その棋 譜をディープ・ラーニングするプログラムを実装しています。 【マシン】 ハードではCPUを1202個つなぎ、その上にGPU(画像処置ユニット) を、176個も搭載させました。GPUは、PCの画像を描画するプロセッ サーです。 並列処理に特化した高性能をもちます。 棋譜のディープ・ラーンニングから、回帰分析の算式を導くには、 大量の「行列計算」が必要です。これには、CPUが得意な逐次計算 ではなく、並列計算が必要です。その並列計算にGPUを使っていま す。 このスーパー・コンピュータのハードにのったアルファ碁は、1秒 に1局(約250手)の自己対戦ができるという。(注)事業仕分け で蓮舫議員が言った「2位ではダメなんですか」で有名になった、 わが国の「京(けい)」の処理能力は、1秒に1京回(1億の1万 倍)の演算です(政府の開発費1120億円)。グーグルは、この京と 同様のCPUを準備したのでしょう。 【12か月で3000万局の自己対戦】 1日は8万6400秒です。8万6400回の自己対戦ができ、その棋譜と最 終結果をデータベースにします。1か月では259万局です。12ヵ月な ら3000万局もの棋譜をディープ・ラーンニングします。プロ棋士が 1日に5局を休まず指しても、1年には2万回です。20年で4万回の 「経験」です。プロ棋士が一生で経験する量の750倍です(750人分 と言ってもいい)。 アルファ碁は、わずか1年で3000万局です。人類の経験をはるかに 超える3000万局のデータベースから、多変量解析の算式を導き、打 つ手を評価しています。最初の3か月目(259万局)まではプロより は弱い。しかし、4か月、5か月と自己対戦を重ね、強くなって行き ます。 【セドルは1勝で称賛された】 名人とされているイ・セドルは、「アルファ碁は、勝負どころで思 いもつかない手を打ってきた。最初変に思えても、手が進むと、あ れが完璧な手だった」という感想を漏らしています。このソフトに 5戦1勝したのですから最初は驚かれましたが、しばらくして全世界 から大きな称賛があったのも当然でしょう。 韓国棋院は、アルファ碁に再戦を申し入れています。現在の世界ナ ンバーワンの、中国のカケツ氏(18歳)も対戦を望んでいるという。 そのとき、アルファ碁がどれくらい強くなっているか。 自己対戦を重ねることで、弱くなることはないと思えないからです。 そのときも、YOUTUBEでは、日本のプロ棋士の解説がついて、実況 されるはずです。 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 【ビジネス知識源アンケート:感想は自由な内容で。 以下は、項目の目処です】 1.内容は、興味がもてますか? 2.理解は進みましたか? 3.疑問点、ご意見はありますか? 4.その他、感想、希望テーマ等 5.差し支えない範囲であなたの横顔情報があると、今後のテーマ と記述のとき、より的確に書く参考になります。 気軽に送信してください。感想やご意見は、励みと参考にもなり、 うれしく読んでいます。時間の関係で、質問への返事や回答ができ ないときも全部を読み、多くの希望がある共通のものは記事に反映 させるよう努めます。 【著者へのひとことメール、および読者アンケートの送信先】 yoshida@cool-knowledge.com ◎購読方法と届かないことに関する問い合わせは、ここにメール → reader_yuryo@mag2.com ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ■1.有料版のご購読の案内 新年にちなみ毎週、質の高い論を展開する有料版はいかがでしょう。 (↓)毎週水曜日に送信され、料金は月間648円(税込み)です。 http://www.mag2.com/m/P0000018.html ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ <809号:世界経済の基底にある原油と原油価格> 2015年1月27日:有料版 【目次】 1.元からのマネー大脱走の元になったのは、株マネー 2.今後はどうなるか? 3.原油とドルと軍事 4.原油価格と株価の関係(2015年~2016年) 5.世界の原油需要のアウトライン 【後記】 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ~~ <810号:増刊: 世界経済の基底にある原油と原油価格(2)> 2016年2月1日:有料版 【目次】 1.原油価格が下がった理由 2.原油価格が上がるために必要なこと 3.今後の原油価格についての結論 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ~~~ ◎登録、解除は、ご自分でお願いします。 (まぐまぐ有料版↓) http://www.mag2.com/m/P0000018.html (まぐまぐ無料版↓) http://www.mag2.com/m/0000048497.html 【↓まぐまぐ会員登録と解除の方法】 http://www.mag2.com/howtouse.html#regist ■2.「まぐまぐの有料版を解約していないのに、月初から届かな くなった。」との問い合わせが、当方にも多いのですが、ほとんど の原因は、クレジットカードの「有効期限切れ」です。 なお、登録情報は、まぐまぐの『マイページ ログイン』の画面を 開き、登録していた旧アドレスとパスワードでログインして出てき たマイページで、メールアドレス、パスワード、クレジットカード を新しいものに変更できる仕組みです。クレジットカードの変更、 送信メールアドレスの変更、パスワードの変更などに使ってくださ い (マイページ・ログイン↓) https://mypage.mag2.com/Welcome.do または↓ https://mypage.mag2.com/mypage/creditcard/CreditCardMenu.do 新しいカードと有効期限を登録すると、その月の届かなかった分を 含んで、再送されます。 ↓わからないときの問い合わせ先: reader_yuryo@mag2.com 回答が来る時間は、休日を除く、午前10時から午後5時です。 【お知らせ】 新しいメルマガ配信サイトの『フーミー:Foomi』からなら、 (1)銀行振り込み、(2)携帯キャリア決済、(3)コンビニ決済 で、有料版の購読ができます。 クレジットカードの登録がイヤな 方はご利用ください(↓) http://foomii.com/00023 ◎このメルマガに返信すると発行者さんにメッセージを届けられます ※発行者さんに届く内容は、メッセージ、メールアドレスです ◎ビジネス知識源:経営の成功原理と実践原則 のバックナンバーはこちら ⇒ http://archives.mag2.com/0000048497/index.html ◎ビジネス知識源:経営の成功原理と実践原則 の配信停止はこちら ⇒ http://www.mag2.com/m/0000048497.html |