ハッカーの系譜(10)マービン・ミンスキー (7) チェスをするプログラムは「人工知能」と呼べるのだろうか

牧野武文

March 7, 2017 11:30
by 牧野武文

人間が勝ち方を教えるゲームプログラム

当時、MIT人工知能研究所のハッカーの一人だったリチャード・グリーンブラットは、チェスをするプログラムを書くことに夢中になっていた。チェスをするプログラムは「人工知能」と呼べるのだろうか。いつもそのことが話題になっていた。

リチャード・グリーンブラット2009年撮影 Photo by Wikipedia

チェスに限らず、ゲームをするプログラムの基本構造は探索木だ。先手、後手が打つ手をすべてツリー状にまとめたものが基本構造になる。このすべての手に評価関数と呼ばれるもので得点をつけていく。そして、プログラムは自分の得点がもっとも高くなる手を採用し、相手の人間も自分の得点がもっとも高くなる=評価関数上は最低の得点の手を打つだろうと想定し、計算を進めていく。

ところで、問題はこの評価関数の中身だ。ここはそのゲームプログラムの最大のノウハウになるところで、たとえばポーンの数が4つ以上あったら1点、ルークやビショップの動けるマスが多ければ1点というように、プラグラミングする人が決めていく。そのため、強いチェスプログラムを書くには、本人がまずチェスをよく知り、強くなければならない。

これは、コンピューターが考える=知能をもっていることになるだろうか。答えはノーだ。なぜなら、人間がチェスの勝ち方を教え、コンピューターはひたすら計算をするだけだからだ。

1997年に、傑出したチェス世界チャンピオン、ガルリ・カスパロフを、IBMのディープブルーが破ったが、このときのディープブルーは猛烈に並列計算をする計算機で、人間がつくった評価関数に基づいていた。そのため、ディープブルーは人工知能ではない。

チェス界の天才 ガルリ・カスパロフ

自分で勝ち方を編みだす深層学習

一方で、近年のグーグルのAlphaGoなどでは、人間が勝ち方を教えたりはしない。ひたすら対局の棋譜を読ませていき、深層学習によって、評価関数も自動生成する。つまり、勝ちパターンを分析して、自力で勝ち方を編みだしていくのだ。さらに、学習素材とする棋譜は、過去の 「人間同士の対戦」が基本になるが、ある程度学習が進んだところで、今度は深層学習したコンピューター同士で対戦させて、深層学習を進め、さらなる勝ちパターンを編みだしていく。コンピューター同士の対戦であれば、1日に何千局、何万局と対戦できるので、学習の進み方は飛躍的に伸びていく。しかも、人間なら絶対打たない手も学習できるので、最終的には人間から見れば「そんな新手があったのか!」と驚く勝ち方をするようになる。

これは考えていることになるのだろうか。「勝ち方を自動生成する」と言うと、いかにも考えているような気もするが、それも一定のアルゴリズムに従って学習をしているだけのことだ。結果だけを見れば、知能によって考えているように見えるが、機械的に学習をしているだけとも言える。

では、人間はどうなのか。人間だって、たくさんの対戦をして、さまざまな局面の経験を積み、勝ち方を編みだしていく。これは考えているのだろうか、それとも機械的に学習しているだけだろうか。人工知能を考える上では、「考えるとはどういうことか」ということがわからなくなっていく。

不完全でも機能する「知能」

グリーンブラットのチェスプログラムは優秀だった。アマチュアの強豪には勝てるようになり、アマチュアの大会に出場をして好成績を収めるようになっていった。このプログラムは、面白いやり方で指し手を計算している。最初にまず簡単な評価関数を使って、有望な手を7つ選びだす。それからその7つの手について、先読みをし、詳細に評価をし、打ち手を決定する。すべての手について詳細に検討をしていたら、とても計算時間が足らないので、このような手法をとった。

ところが、だいぶ経ってわかったことだが、大きなバグがあった。最初に有望な手を7つ選んでいるのではなく、有望な手を6つと最悪の手を1つ選んでいたのだ。グリーブラットも周囲の人間も、ミンスキー自身も、このようなバグが潜んでいることにまったく気がつかなかった。

ミンスキーは、このチェスプログラムが実に人間的で、知能の片鱗をもっていると感じた。なぜなら、人間はなにかを選択するときに、最悪の事態も想像して不安におびえるからだ。しかし、ほとんどの人はその最悪の想像を表にはださない。そのため、端から見れば、常に冷静に正しい選択をしている人に見える。このチェスプログラムは、常に正しい選択をしているように見えて、その深層心理では最悪のことも考慮に入れていたのだ。

ミンスキーは「考えるとはなにか」ということを深く考察していくようになった。ミンスキーの人工知能グループは、ようやく目指すべき道筋が見えるようになり、ミンスキー以下研究員はそれぞれの研究に没頭するようになった。

パーセプトロンが発明される

ミンスキーはあいかわらず機械づくりが好きだったが、人工知能の研究では機械づくりから遠ざかった。ひとつは以前つくった迷路学習装置SNARCを振り返ってみて、機械で知能を実現する限界を感じたからだ。機械の限界を超えてくれるのがコンピューターだったが、ミンスキーはコンピューターにも限界を感じていた。SNARCのような機械、コンピューターはまだまだ力不足だが、将来性能があがっていけば人工の知能を再現できるのだと考える研究者も多かったが、ミンスキーはなにか違和感を感じていた。性能や規模の問題ではなく、知能には、なにか根本的な原理、あるいは秘密が隠されているのではないだろうか。それを見つけるため、ミンスキーは手を動かすことをやめて、思索に没頭するようになった。しかし、これといったブレイクスルーはなにも起きないままだった。

その頃、1959年、同じブロンクス科学高校に在籍をして、コーネル大学航空研究所に就職をしたフランク・ローゼンブラットがマーク1という不思議な機械を開発した。これは後にパーセプトロンと呼ばれるものだった。大雑把に言えば、現在のディープラーニングもこのパーセプトロンを進化させ、多層化させたもので学習をする。現在の人工知能研究にもつながる画期的な発明だった。
 
(その8に続く)

BugBounty.jp

システムに内在するリスクをチェックセキュリティ診断(脆弱性診断)

提供会社:スプラウト

企業や組織のWebアプリケーション、各種サーバー、スマートフォンアプリケーション、IoTデバイスなどの特定の対象について、内外の攻撃の糸口となる脆弱性の有無を技術的に診断します。外部に公開す るシステムを安心かつ安全に維持するためには、定期的なセキュリティ診断が欠かせません。

BugBounty.jp

サイバー空間の最新動向を分析脅威リサーチ

提供会社:スプラウト

サイバー攻撃に関連した機密情報や個人情報が漏洩していないかをダークウェブも含めて調査し、もし重要な情報が発見された場合は、その対応策についてもサポートします。また、サイバー攻撃者のコミ ュニティ動向を分析し、特定の業種や企業を狙った攻撃ツールやターゲットリストが出回っていないかなどの特殊な脅威調査も請け負っています。

自動車ナンバープレートの「良番」が大量に手に入る理由

April 17, 2018 08:00

by 牧野武文

四川省涼山州公安の交通警察は、自動車ナンバー取得システムに侵入し、「88888」などの縁起のいいナンバーを公開直後に不正取得し、転売をしていた犯罪集団56人を逮捕したと『新京報網』が報じた。 自動車ナンバープレート約13億円 中国人は、数字に異常とも言えるこだわりを見せる。例えば、携帯電話の番号にも…

中国ホワイトハッカーのお給料はおいくら万円?

April 10, 2018 08:00

by 牧野武文

中国のセキュリティエンジニアは、どのくらいの給料をもらっているのか。中国情報安全評価センターは、「中国情報安全従業員現状調査報告(2017年版)」(PDF)を公開した。これによるとITの急速な発展により、中国の産業地図に変化が起きていることが明らかになった。 中国でも男性が多い職業 中国で急成長をす…