ハッカーの系譜(10)マービン・ミンスキー (8) 世界初 機械学習可能なネットワーク「パーセプトロン」誕生

牧野武文

March 10, 2017 08:00
by 牧野武文

網膜の仕組みにヒントを得たパーセプトロン

フランク・ローゼンブラットが着目したのは、眼球の仕組みだった。網膜が光を受けて、それが視神経(ニューロン)を経て、脳につながっている。つまり、私たちが「ものを見る」ときはなんらかの情報処理がおこなわれていることになる。目の前にあるサイコロを見たときに、脳はサイコロの形を直接見ているわけではなく、一定の信号パターンを感知して、学習することで「このパターンは立方体だ」という判断をしていることになる。

その証拠に、人間に目にはさまざまな錯視が知られている。カフェウォール錯視では市松模様のタイルをずらして並べると、水平のタイルが傾いているかのように見える。カニッツァの三角形、市松模様錯視では、存在しない図形が見えるように感じる。これらは視神経系の学習結果の裏をかいたような図形なのだ。錯視図形は自然界には存在しないので、人間は自然界の映像を正確にとらえるように視神経が学習されていく。そのために、人工的な図形では学習成果が裏目にでて、ちょっとした撹乱を起こしてしまうのだ。

タイルが傾いて見える「カフェウォール錯視」 Wikipediaより

当時、神経の成長はランダムなもので、学習を経て、うまくいく神経連結が強化され、そうでない神経連結が弱められることにより、学習されていくと考えられていた。だとしたら、視神経のモデルをつくり、神経にあたる接続を最初はランダムにして、学習結果を見ながら配線を調整してやれば、形を見わけることができる視神経モデルがつくれるのではないか。ローゼンブラットはそう考えた。

文字の形を認識できるようになったパーセプトロン

ローゼンブラットが開発したパーセプトロンのプロトタイプであるマーク1は、現在のデジタルカメラの構造とよく似ている。前面にあるのは20×20に並べられた400個の光電管で、光を受けると電気信号を発する。現在のデジカメのCCDのようなもの、眼球で言えば網膜にあたるものだと考えるとわかりやすい。

その奥にあるものがローゼンブラットが連合素子と呼んだもので、520個の素子の集合体だ。この素子は、光電管からの電気信号を受け取って、一定以上の値になると、電気信号を出力する。ポイントは、この連合素子ひとつひとつは、それぞれ40個の光電管とランダムに、つまりめちゃくちゃに配線されているということだ。接続された光電管がどの位置にあるかはわからないが、40の光電管のうち大半が光を受ければ、この連合素子は電気信号を発する。接続された40の光電管の大半が光を受けなければ、この連合素子は電気信号を発しない。

最後は応答素子で、複数の連合素子と規則的に配線されていて、しかも後でその配線を変えて調整できるようになっている。接続された複数の連合素子の大半が電気信号を発すれば、応答素子も電気信号を出力する。

このようなパーセプトロンに、□や△、A、Bなどの単純な図形や文字を見せる。第1層の光電管は、図形と同じ形に反応をして電気信号を発する。しかし、それが伝えられる連合素子にはランダムに配線されているので、どの連合素子が反応するかはまったくわからない。しかし、いくつかの連合素子は反応して電気信号を発するだろう。

この連合素子から発せられた電気信号は、応答素子に伝えられ、いくつかの応答素子が反応することになる。もちろん、どの応答素子が反応するかはまったくわからないが、同じAという文字を見せれば、同じ応答素子が反応することになるだろう。では、Aという文字を横にずらすと、応答素子の反応はどうなるだろうか。あるいはAという文字を大きくしたり小さくしたりすると応答素子の反応はどうなるだろうか。

このようなさまざまな状態のAという文字を見せたときに、反応する応答素子になんらかの共通パターンが生まれるように、連合素子と応答素子の間の配線を試行錯誤で調整していく。この調整を繰り返していくと、どのようなAという文字を見せても、応答素子は共通した反応パターンを示すようになる。これは「学習」したということにならないだろうか。このパーセプトロンはAという文字を認識できるようになったということはできないだろうか。

直感でパーセプトロンの限界を感じたミンスキー

ローゼンブラットは、視神経を模したマーク1を一般の神経モデルにまで拡張し、パーセプトロンとして発表した。このパーセプトロンは、瞬く間に大きな反響を引き起こした。曲がりなりにも、機械が単純な図形を認識するようになったのだ。世界初の機械学習だった。しかも、今は技術的な制限から単純な機械ではあるけど、将来的には集積素子=LSI化することもできるし、コンピューターのプログラムとして組むこともできる。このようなLSIやソフトウェアをさまざまな家電製品や自動車に組みこんだらどういうことが起こるだろうか。

ローゼンブラットのパーセプトロンは、ミンスキーのSNARCと基本構造がよく似ていた。当然だ。どちらも神経のモデルを機械に置き換えたものだからだ。しかし、世界がパーセプトロンに熱狂し、追試研究や模倣をし始めたころ、ミンスキーは一人冷静だった。SNARCを製作した経験から、パーセプトロンの限界を直感していたからだ。

たとえばパーセプトロンは、アルファベット文字や単純な図形しか学習することができない。でも、それは素子の数が少ないという現実的な理由によるものだとされていた。技術が進歩し、光電管や素子を何個使っても問題ないほど安くなり、あるいはコンピューターの処理能力が飛躍的に伸びれば、大規模なパーセプトロンを開発するすることで、複雑な図形も学習できるようになると、ローゼンブラットは主張する。将来は、街頭の監視カメラの映像から指名手配犯の顔を認識して通報するシステムだってつくれると言うのだ。

ミンスキーは規模や複雑さの問題ではないと直感していた。パーセプトロンをいかに複雑、大規模にしたところで、結局学習できるのは単純図形でしかないだろうと感じた。実際、Aという文字図形を学習したパーセプトロンに、Aの文字の背景に斜線を一本入れただけの図形を見せると、まったく認識できなくなる。ちょっとした撹乱要因があるだけで、パーセプトロンの認識機能は崩壊してしまうのだ。

しかも、パーセプトロンを大型複雑化しても、学習できる内容はさほど精密にならないのに、このような撹乱要因の影響は大きくなる。なにかが間違っていて、みな、誤った道に入りこもうとしているとミンスキーは感じた。
 
(その9に続く)




ハッカーの系譜(10)マービン・ミンスキー (10) 多層化することで問題を解決

March 30, 2017 08:00

by 牧野武文

多層化することでXOR問題を乗り越えられる パーセプトロンの第1の進化は多層化だ。ミンスキーが指摘したように、パーセプトロンはXORの論理演算結果を学習することができない。前回示したように、XORの演算結果は線形分離不可能、つまり直線で真と偽のグループにわけることができないからだ。 しかし、実はちょ…

POSマルウェアの恐怖 (4) クレジットカード番号が顧客番号や業務処理のキーとして活用される

March 29, 2017 08:00

by 牧野武文

  ・POSマルウェアの恐怖(1) PCI DSSに準拠しても防げない? 狙われるPOSシステム ・POSマルウェアの恐怖(2) カード情報が平文で通信されるシステム ・POSマルウェアの恐怖(3) カード情報を全プロセスで暗号化する「PCI P2PE」はPOSマルウェア攻撃を防げるか POSレジを…

IoTヌイグルミは口が軽い!? ユーザー情報82万件がダダ漏れに(後編)

March 28, 2017 08:00

by 江添 佳代子

  →IoTヌイグルミは口が軽い!? ユーザー情報82万件がダダ漏れに(前編) →IoTヌイグルミは口が軽い!? ユーザー情報82万件がダダ漏れに(中編) 何も知らされていなかったユーザー ここでいったん時系列を確認しよう。ハントやロレンゾに情報を提供した人物がCloudPetsへの連絡を試みたのは…

中国で9億アカウントが利用する「WiFi万能鍵」が1308種類の偽アプリを一掃

March 27, 2017 10:30

by 牧野武文

『中国経済網』の報道によると、中国で大人気のアプリ「WiFi万能鍵」を開発した上海連尚科技有限公司は、今年3月までに、1308種類の偽アプリを一掃したと発表した。 アカウント数9億件を超える無線LANユーティリティーソフト WiFi万能鍵は、公衆無線LANに自動接続するAndroid・iOSアプリ。…