ハッカーの系譜(10)マービン・ミンスキー (7) チェスをするプログラムは「人工知能」と呼べるのだろうか

牧野武文

March 7, 2017 11:30
by 牧野武文

人間が勝ち方を教えるゲームプログラム

当時、MIT人工知能研究所のハッカーの一人だったリチャード・グリーンブラットは、チェスをするプログラムを書くことに夢中になっていた。チェスをするプログラムは「人工知能」と呼べるのだろうか。いつもそのことが話題になっていた。

リチャード・グリーンブラット2009年撮影 Photo by Wikipedia

チェスに限らず、ゲームをするプログラムの基本構造は探索木だ。先手、後手が打つ手をすべてツリー状にまとめたものが基本構造になる。このすべての手に評価関数と呼ばれるもので得点をつけていく。そして、プログラムは自分の得点がもっとも高くなる手を採用し、相手の人間も自分の得点がもっとも高くなる=評価関数上は最低の得点の手を打つだろうと想定し、計算を進めていく。

ところで、問題はこの評価関数の中身だ。ここはそのゲームプログラムの最大のノウハウになるところで、たとえばポーンの数が4つ以上あったら1点、ルークやビショップの動けるマスが多ければ1点というように、プラグラミングする人が決めていく。そのため、強いチェスプログラムを書くには、本人がまずチェスをよく知り、強くなければならない。

これは、コンピューターが考える=知能をもっていることになるだろうか。答えはノーだ。なぜなら、人間がチェスの勝ち方を教え、コンピューターはひたすら計算をするだけだからだ。

1997年に、傑出したチェス世界チャンピオン、ガルリ・カスパロフを、IBMのディープブルーが破ったが、このときのディープブルーは猛烈に並列計算をする計算機で、人間がつくった評価関数に基づいていた。そのため、ディープブルーは人工知能ではない。

チェス界の天才 ガルリ・カスパロフ

自分で勝ち方を編みだす深層学習

一方で、近年のグーグルのAlphaGoなどでは、人間が勝ち方を教えたりはしない。ひたすら対局の棋譜を読ませていき、深層学習によって、評価関数も自動生成する。つまり、勝ちパターンを分析して、自力で勝ち方を編みだしていくのだ。さらに、学習素材とする棋譜は、過去の 「人間同士の対戦」が基本になるが、ある程度学習が進んだところで、今度は深層学習したコンピューター同士で対戦させて、深層学習を進め、さらなる勝ちパターンを編みだしていく。コンピューター同士の対戦であれば、1日に何千局、何万局と対戦できるので、学習の進み方は飛躍的に伸びていく。しかも、人間なら絶対打たない手も学習できるので、最終的には人間から見れば「そんな新手があったのか!」と驚く勝ち方をするようになる。

これは考えていることになるのだろうか。「勝ち方を自動生成する」と言うと、いかにも考えているような気もするが、それも一定のアルゴリズムに従って学習をしているだけのことだ。結果だけを見れば、知能によって考えているように見えるが、機械的に学習をしているだけとも言える。

では、人間はどうなのか。人間だって、たくさんの対戦をして、さまざまな局面の経験を積み、勝ち方を編みだしていく。これは考えているのだろうか、それとも機械的に学習しているだけだろうか。人工知能を考える上では、「考えるとはどういうことか」ということがわからなくなっていく。

不完全でも機能する「知能」

グリーンブラットのチェスプログラムは優秀だった。アマチュアの強豪には勝てるようになり、アマチュアの大会に出場をして好成績を収めるようになっていった。このプログラムは、面白いやり方で指し手を計算している。最初にまず簡単な評価関数を使って、有望な手を7つ選びだす。それからその7つの手について、先読みをし、詳細に評価をし、打ち手を決定する。すべての手について詳細に検討をしていたら、とても計算時間が足らないので、このような手法をとった。

ところが、だいぶ経ってわかったことだが、大きなバグがあった。最初に有望な手を7つ選んでいるのではなく、有望な手を6つと最悪の手を1つ選んでいたのだ。グリーブラットも周囲の人間も、ミンスキー自身も、このようなバグが潜んでいることにまったく気がつかなかった。

ミンスキーは、このチェスプログラムが実に人間的で、知能の片鱗をもっていると感じた。なぜなら、人間はなにかを選択するときに、最悪の事態も想像して不安におびえるからだ。しかし、ほとんどの人はその最悪の想像を表にはださない。そのため、端から見れば、常に冷静に正しい選択をしている人に見える。このチェスプログラムは、常に正しい選択をしているように見えて、その深層心理では最悪のことも考慮に入れていたのだ。

ミンスキーは「考えるとはなにか」ということを深く考察していくようになった。ミンスキーの人工知能グループは、ようやく目指すべき道筋が見えるようになり、ミンスキー以下研究員はそれぞれの研究に没頭するようになった。

パーセプトロンが発明される

ミンスキーはあいかわらず機械づくりが好きだったが、人工知能の研究では機械づくりから遠ざかった。ひとつは以前つくった迷路学習装置SNARCを振り返ってみて、機械で知能を実現する限界を感じたからだ。機械の限界を超えてくれるのがコンピューターだったが、ミンスキーはコンピューターにも限界を感じていた。SNARCのような機械、コンピューターはまだまだ力不足だが、将来性能があがっていけば人工の知能を再現できるのだと考える研究者も多かったが、ミンスキーはなにか違和感を感じていた。性能や規模の問題ではなく、知能には、なにか根本的な原理、あるいは秘密が隠されているのではないだろうか。それを見つけるため、ミンスキーは手を動かすことをやめて、思索に没頭するようになった。しかし、これといったブレイクスルーはなにも起きないままだった。

その頃、1959年、同じブロンクス科学高校に在籍をして、コーネル大学航空研究所に就職をしたフランク・ローゼンブラットがマーク1という不思議な機械を開発した。これは後にパーセプトロンと呼ばれるものだった。大雑把に言えば、現在のディープラーニングもこのパーセプトロンを進化させ、多層化させたもので学習をする。現在の人工知能研究にもつながる画期的な発明だった。
 
(その8に続く)




ロシア下院が「VPNやプロキシを禁じる新しい法案」を採択

July 26, 2017 08:00

by 江添 佳代子

ロシア連邦議会下院は2017年7月21日、市民のインターネット利用を制限するための法案を全会一致で採択した。 これはロシアでのVPNやプロキシなどの利用を非合法化する法になると伝えられている。この採択を受け、モスクワでは2000人以上の市民が「インターネットの自由」や「ロシア当局によるオンライン監視…

中国北京市に大量の偽携帯基地局が存在する理由

July 25, 2017 08:00

by 牧野武文

以前、偽の携帯電話基地局から大量の広告ショートメッセージ(SMS)を発信した事件をお伝えした。その際、偽携帯基地局からのSMSは、発信元の電話番号を自由に偽装できるため、受信者側では本物のSMSなのか、偽物なのかの見分けがつかないという危険性を指摘した。案の定、中国で、偽携帯基地局から発信したSMS…