メディア
連載
» 2018年06月04日 11時30分 公開

Over the AI ―― AIの向こう側に(22):官能の人工知能 〜深層学習を最も分かりやすく説明するパラダイム (7/10)

[江端智一,EE Times Japan]

全ての試みで学習に成功

 私のプログラムには、入力層144ノード、中間層6ノード、最終層4ノードという、私の人生では試したことがない巨大なニューラルネットワークが登場します(私は、これまで、3桁もの数のノードを持つニューラルネットワークを試したことがありません。なぜなら、1桁でも失敗の日々だったからです)。

 学習の結果ですが ―― 腰が抜けるほど驚きました

 100回以上、初期乱数のシードを変えて、シナプス結合値を変化させて試してみたのですが、学習成功率100% ―― 全ての試みで学習に成功しました。

 『何これ? 入力層のノード144個だよ? そんなこと、本当にあり得る?』 ―― 信じられませんでした。そして、「なるほど、世界が大騒ぎをするはずだ」と納得したのです。

 これはニューラルネットワークというよりは、画像の前処理技術(画像データを、ニューラルネットワークに食べやすいデータに加工した技術)の勝利と言えましょう。私は今、CNNの開発者に対して、心からの最大級の賛辞を申し上げたいです。

 なぜ、CNNがこのような、劇的な成功に至ることできたのか ―― 私は、ここに「エロ写真のモザイク加工処理のコンセプト」を主張したいのです(開発者はきっと怒るでしょうが)。

 本来、画像フィルターとは、「縦方向」とか「横方向」にスリット状にするなど、恣意的に作るものですが、私のプログラムではフィルターは乱数で適当に作られていました(当初、私は、この理由が分かりませんでした(ソースコードをコピー&ペーストしていたからです))。

 しかし、「これは、エロ写真のモザイクだ」と気がついた瞬間、CNNの各種のコードの意味が、私の頭の中で一気に氷解したのです*)

*)「畳み込み」はちょっと説明できませんが、「フィルタリング」と「プーリング」については、十分に解説可能です(このコラムが発禁になるので、具体的な解説は差し控えます))。

 要するに、細部の描写を曖昧にすることで ―― まさに、映倫(映画倫理機構)の狙い通りに ―― 画像を「ぼかす」のです。そして、「私たち」……ではなく、「CNN」が、「細部の情報に心を奪われないように」……ではなくて、「細部の情報を想像(妄想)で補完できるように」データの加工を行う訳です。

 「全体としての画像の概要を開示しつつ、部分の画像に対して、あえて『ぼかす』『隠す』『(見えそうで)見えなくする』という処理を施す」―― これが、人類の、特にティーンエージャの脳の「官能をつかさどる」ニューロンの発生とシナプスの活性化に、どれほど資してきたか、今さら皆さんに説明する必要もないでしょう。

「ぼかして補う」。官能の世界とCNNの世界は似ている?

 ただ、勘違いされては困るのですが、「CNNとは、ニューラルネットワークに、画像に対する官能感知機能が具備したもの」ではありません。間違っても、そのような宣伝をしないようにしてください(一部のプレスが、また変な記事を書きかねないので、念のため)。

 私は、「CNNとは、ニューラルネットワークと好結合する、優れた画像のデータ加工の前処理技術を具備している」と申し上げたいのです。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from UBM Electronics, a division of United Business Media LLC.