ハッカーの系譜(10)マービン・ミンスキー (8) 世界初 機械学習可能なネットワーク「パーセプトロン」誕生

牧野武文

March 10, 2017 08:00
by 牧野武文

網膜の仕組みにヒントを得たパーセプトロン

フランク・ローゼンブラットが着目したのは、眼球の仕組みだった。網膜が光を受けて、それが視神経(ニューロン)を経て、脳につながっている。つまり、私たちが「ものを見る」ときはなんらかの情報処理がおこなわれていることになる。目の前にあるサイコロを見たときに、脳はサイコロの形を直接見ているわけではなく、一定の信号パターンを感知して、学習することで「このパターンは立方体だ」という判断をしていることになる。

その証拠に、人間に目にはさまざまな錯視が知られている。カフェウォール錯視では市松模様のタイルをずらして並べると、水平のタイルが傾いているかのように見える。カニッツァの三角形、市松模様錯視では、存在しない図形が見えるように感じる。これらは視神経系の学習結果の裏をかいたような図形なのだ。錯視図形は自然界には存在しないので、人間は自然界の映像を正確にとらえるように視神経が学習されていく。そのために、人工的な図形では学習成果が裏目にでて、ちょっとした撹乱を起こしてしまうのだ。

タイルが傾いて見える「カフェウォール錯視」 Wikipediaより

当時、神経の成長はランダムなもので、学習を経て、うまくいく神経連結が強化され、そうでない神経連結が弱められることにより、学習されていくと考えられていた。だとしたら、視神経のモデルをつくり、神経にあたる接続を最初はランダムにして、学習結果を見ながら配線を調整してやれば、形を見わけることができる視神経モデルがつくれるのではないか。ローゼンブラットはそう考えた。

文字の形を認識できるようになったパーセプトロン

ローゼンブラットが開発したパーセプトロンのプロトタイプであるマーク1は、現在のデジタルカメラの構造とよく似ている。前面にあるのは20×20に並べられた400個の光電管で、光を受けると電気信号を発する。現在のデジカメのCCDのようなもの、眼球で言えば網膜にあたるものだと考えるとわかりやすい。

その奥にあるものがローゼンブラットが連合素子と呼んだもので、520個の素子の集合体だ。この素子は、光電管からの電気信号を受け取って、一定以上の値になると、電気信号を出力する。ポイントは、この連合素子ひとつひとつは、それぞれ40個の光電管とランダムに、つまりめちゃくちゃに配線されているということだ。接続された光電管がどの位置にあるかはわからないが、40の光電管のうち大半が光を受ければ、この連合素子は電気信号を発する。接続された40の光電管の大半が光を受けなければ、この連合素子は電気信号を発しない。

最後は応答素子で、複数の連合素子と規則的に配線されていて、しかも後でその配線を変えて調整できるようになっている。接続された複数の連合素子の大半が電気信号を発すれば、応答素子も電気信号を出力する。

このようなパーセプトロンに、□や△、A、Bなどの単純な図形や文字を見せる。第1層の光電管は、図形と同じ形に反応をして電気信号を発する。しかし、それが伝えられる連合素子にはランダムに配線されているので、どの連合素子が反応するかはまったくわからない。しかし、いくつかの連合素子は反応して電気信号を発するだろう。

この連合素子から発せられた電気信号は、応答素子に伝えられ、いくつかの応答素子が反応することになる。もちろん、どの応答素子が反応するかはまったくわからないが、同じAという文字を見せれば、同じ応答素子が反応することになるだろう。では、Aという文字を横にずらすと、応答素子の反応はどうなるだろうか。あるいはAという文字を大きくしたり小さくしたりすると応答素子の反応はどうなるだろうか。

このようなさまざまな状態のAという文字を見せたときに、反応する応答素子になんらかの共通パターンが生まれるように、連合素子と応答素子の間の配線を試行錯誤で調整していく。この調整を繰り返していくと、どのようなAという文字を見せても、応答素子は共通した反応パターンを示すようになる。これは「学習」したということにならないだろうか。このパーセプトロンはAという文字を認識できるようになったということはできないだろうか。

直感でパーセプトロンの限界を感じたミンスキー

ローゼンブラットは、視神経を模したマーク1を一般の神経モデルにまで拡張し、パーセプトロンとして発表した。このパーセプトロンは、瞬く間に大きな反響を引き起こした。曲がりなりにも、機械が単純な図形を認識するようになったのだ。世界初の機械学習だった。しかも、今は技術的な制限から単純な機械ではあるけど、将来的には集積素子=LSI化することもできるし、コンピューターのプログラムとして組むこともできる。このようなLSIやソフトウェアをさまざまな家電製品や自動車に組みこんだらどういうことが起こるだろうか。

ローゼンブラットのパーセプトロンは、ミンスキーのSNARCと基本構造がよく似ていた。当然だ。どちらも神経のモデルを機械に置き換えたものだからだ。しかし、世界がパーセプトロンに熱狂し、追試研究や模倣をし始めたころ、ミンスキーは一人冷静だった。SNARCを製作した経験から、パーセプトロンの限界を直感していたからだ。

たとえばパーセプトロンは、アルファベット文字や単純な図形しか学習することができない。でも、それは素子の数が少ないという現実的な理由によるものだとされていた。技術が進歩し、光電管や素子を何個使っても問題ないほど安くなり、あるいはコンピューターの処理能力が飛躍的に伸びれば、大規模なパーセプトロンを開発するすることで、複雑な図形も学習できるようになると、ローゼンブラットは主張する。将来は、街頭の監視カメラの映像から指名手配犯の顔を認識して通報するシステムだってつくれると言うのだ。

ミンスキーは規模や複雑さの問題ではないと直感していた。パーセプトロンをいかに複雑、大規模にしたところで、結局学習できるのは単純図形でしかないだろうと感じた。実際、Aという文字図形を学習したパーセプトロンに、Aの文字の背景に斜線を一本入れただけの図形を見せると、まったく認識できなくなる。ちょっとした撹乱要因があるだけで、パーセプトロンの認識機能は崩壊してしまうのだ。

しかも、パーセプトロンを大型複雑化しても、学習できる内容はさほど精密にならないのに、このような撹乱要因の影響は大きくなる。なにかが間違っていて、みな、誤った道に入りこもうとしているとミンスキーは感じた。
 
(その9に続く)




ロシア下院が「VPNやプロキシを禁じる新しい法案」を採択

July 26, 2017 08:00

by 江添 佳代子

ロシア連邦議会下院は2017年7月21日、市民のインターネット利用を制限するための法案を全会一致で採択した。 これはロシアでのVPNやプロキシなどの利用を非合法化する法になると伝えられている。この採択を受け、モスクワでは2000人以上の市民が「インターネットの自由」や「ロシア当局によるオンライン監視…

中国北京市に大量の偽携帯基地局が存在する理由

July 25, 2017 08:00

by 牧野武文

以前、偽の携帯電話基地局から大量の広告ショートメッセージ(SMS)を発信した事件をお伝えした。その際、偽携帯基地局からのSMSは、発信元の電話番号を自由に偽装できるため、受信者側では本物のSMSなのか、偽物なのかの見分けがつかないという危険性を指摘した。案の定、中国で、偽携帯基地局から発信したSMS…