ハッカーの系譜(10)マービン・ミンスキー (8) 世界初 機械学習可能なネットワーク「パーセプトロン」誕生

牧野武文

March 10, 2017 08:00
by 牧野武文

網膜の仕組みにヒントを得たパーセプトロン

フランク・ローゼンブラットが着目したのは、眼球の仕組みだった。網膜が光を受けて、それが視神経(ニューロン)を経て、脳につながっている。つまり、私たちが「ものを見る」ときはなんらかの情報処理がおこなわれていることになる。目の前にあるサイコロを見たときに、脳はサイコロの形を直接見ているわけではなく、一定の信号パターンを感知して、学習することで「このパターンは立方体だ」という判断をしていることになる。

その証拠に、人間に目にはさまざまな錯視が知られている。カフェウォール錯視では市松模様のタイルをずらして並べると、水平のタイルが傾いているかのように見える。カニッツァの三角形、市松模様錯視では、存在しない図形が見えるように感じる。これらは視神経系の学習結果の裏をかいたような図形なのだ。錯視図形は自然界には存在しないので、人間は自然界の映像を正確にとらえるように視神経が学習されていく。そのために、人工的な図形では学習成果が裏目にでて、ちょっとした撹乱を起こしてしまうのだ。

タイルが傾いて見える「カフェウォール錯視」 Wikipediaより

当時、神経の成長はランダムなもので、学習を経て、うまくいく神経連結が強化され、そうでない神経連結が弱められることにより、学習されていくと考えられていた。だとしたら、視神経のモデルをつくり、神経にあたる接続を最初はランダムにして、学習結果を見ながら配線を調整してやれば、形を見わけることができる視神経モデルがつくれるのではないか。ローゼンブラットはそう考えた。

文字の形を認識できるようになったパーセプトロン

ローゼンブラットが開発したパーセプトロンのプロトタイプであるマーク1は、現在のデジタルカメラの構造とよく似ている。前面にあるのは20×20に並べられた400個の光電管で、光を受けると電気信号を発する。現在のデジカメのCCDのようなもの、眼球で言えば網膜にあたるものだと考えるとわかりやすい。

その奥にあるものがローゼンブラットが連合素子と呼んだもので、520個の素子の集合体だ。この素子は、光電管からの電気信号を受け取って、一定以上の値になると、電気信号を出力する。ポイントは、この連合素子ひとつひとつは、それぞれ40個の光電管とランダムに、つまりめちゃくちゃに配線されているということだ。接続された光電管がどの位置にあるかはわからないが、40の光電管のうち大半が光を受ければ、この連合素子は電気信号を発する。接続された40の光電管の大半が光を受けなければ、この連合素子は電気信号を発しない。

最後は応答素子で、複数の連合素子と規則的に配線されていて、しかも後でその配線を変えて調整できるようになっている。接続された複数の連合素子の大半が電気信号を発すれば、応答素子も電気信号を出力する。

このようなパーセプトロンに、□や△、A、Bなどの単純な図形や文字を見せる。第1層の光電管は、図形と同じ形に反応をして電気信号を発する。しかし、それが伝えられる連合素子にはランダムに配線されているので、どの連合素子が反応するかはまったくわからない。しかし、いくつかの連合素子は反応して電気信号を発するだろう。

この連合素子から発せられた電気信号は、応答素子に伝えられ、いくつかの応答素子が反応することになる。もちろん、どの応答素子が反応するかはまったくわからないが、同じAという文字を見せれば、同じ応答素子が反応することになるだろう。では、Aという文字を横にずらすと、応答素子の反応はどうなるだろうか。あるいはAという文字を大きくしたり小さくしたりすると応答素子の反応はどうなるだろうか。

このようなさまざまな状態のAという文字を見せたときに、反応する応答素子になんらかの共通パターンが生まれるように、連合素子と応答素子の間の配線を試行錯誤で調整していく。この調整を繰り返していくと、どのようなAという文字を見せても、応答素子は共通した反応パターンを示すようになる。これは「学習」したということにならないだろうか。このパーセプトロンはAという文字を認識できるようになったということはできないだろうか。

直感でパーセプトロンの限界を感じたミンスキー

ローゼンブラットは、視神経を模したマーク1を一般の神経モデルにまで拡張し、パーセプトロンとして発表した。このパーセプトロンは、瞬く間に大きな反響を引き起こした。曲がりなりにも、機械が単純な図形を認識するようになったのだ。世界初の機械学習だった。しかも、今は技術的な制限から単純な機械ではあるけど、将来的には集積素子=LSI化することもできるし、コンピューターのプログラムとして組むこともできる。このようなLSIやソフトウェアをさまざまな家電製品や自動車に組みこんだらどういうことが起こるだろうか。

ローゼンブラットのパーセプトロンは、ミンスキーのSNARCと基本構造がよく似ていた。当然だ。どちらも神経のモデルを機械に置き換えたものだからだ。しかし、世界がパーセプトロンに熱狂し、追試研究や模倣をし始めたころ、ミンスキーは一人冷静だった。SNARCを製作した経験から、パーセプトロンの限界を直感していたからだ。

たとえばパーセプトロンは、アルファベット文字や単純な図形しか学習することができない。でも、それは素子の数が少ないという現実的な理由によるものだとされていた。技術が進歩し、光電管や素子を何個使っても問題ないほど安くなり、あるいはコンピューターの処理能力が飛躍的に伸びれば、大規模なパーセプトロンを開発するすることで、複雑な図形も学習できるようになると、ローゼンブラットは主張する。将来は、街頭の監視カメラの映像から指名手配犯の顔を認識して通報するシステムだってつくれると言うのだ。

ミンスキーは規模や複雑さの問題ではないと直感していた。パーセプトロンをいかに複雑、大規模にしたところで、結局学習できるのは単純図形でしかないだろうと感じた。実際、Aという文字図形を学習したパーセプトロンに、Aの文字の背景に斜線を一本入れただけの図形を見せると、まったく認識できなくなる。ちょっとした撹乱要因があるだけで、パーセプトロンの認識機能は崩壊してしまうのだ。

しかも、パーセプトロンを大型複雑化しても、学習できる内容はさほど精密にならないのに、このような撹乱要因の影響は大きくなる。なにかが間違っていて、みな、誤った道に入りこもうとしているとミンスキーは感じた。
 
(その9に続く)

BugBounty.jp

必要な情報を収集・分析脅威リサーチ

サイバー攻撃に関連した機密情報や個人情報が漏洩していないかをダークウェブも含めて調査し、もし重要な情報が発見された場合は、その対応策についてもサポートします。また、サイバー攻撃者のコミ ュニティ動向を分析し、特定の業種や企業を狙った攻撃ツールやターゲットリストが出回っていないかなどの特殊な脅威調査も請け負っています。

公衆無線LANを悪用した暗号通貨マイニング術

January 19, 2018 08:00

by Zeljka Zorz

何も疑っていないユーザーのマシンを使って密かに暗号通貨のマイニングをさせることは、暗号通貨オーナーにとっての夢のような話だ。そして彼らの一部は、倫理的配慮を考えずにその夢の実現に取り組んでいる。 一般的に用いられる2つのアプローチは、コンピューターやウェブサイトを危殆化し、マイニングのソフトウェアを…

ベトナム政府が背後にいる!? ハッカー集団「APT32」の暗躍

January 15, 2018 08:10

by 牧野武文

アジア圏で暗躍するハッカー集団がいる。「APT32」あるいは「オーシャンロータス」(Ocean Lotus Group)と呼ばれる組織だ。どちらの名前も、観測をした研究者が命名したものであり、正式名称は不明だ。米セキュリティ企業ボレシティ(Volexity)は、ブログでこのオーシャンロータスが、ベト…

国内の言論統制が目的か? ベトナム人民軍のサイバー部隊「Force 47」(後編)

January 12, 2018 08:00

by 江添 佳代子

近年のベトナムとFacebook 前編でお伝えしたとおり、オンラインでの自由な発言を国民に許可していないベトナムは、中国やトルコなどの国とたびたび比較されてきた。しかし、これらの国々の中では比較的「ブロックが手ぬるいほう」だったと言えるかもしれない。 たとえばベトナムは2009年頃からFaceboo…