連載
» 2016年11月29日 11時30分 UPDATE

Over the AI ――AIの向こう側に(5):沈黙する人工知能 〜なぜAIは米大統領選の予測に使われなかったのか (9/9)

[江端智一,EE Times Japan]
前のページへ 1|2|3|4|5|6|7|8|9       

「デタラメ」を作ることは結構難しい

 これまで私は、C/C++を使って、簡単なシミュレーションプログラムを作ってきました。私には、ある対象の全体像を理解する手段としては、数式や論理で理解するより、直感的で簡単で早いからです。

 シミュレーションプログラムでは、なるべく異なる状況を作り出すために、頻繁に乱数を使います。私の場合、C/C++で標準実装されている乱数生成関数(rand())を使ってきました。

 rand()は、線形合同法という方式を使っています。これは、簡単な数式で実装でき、計算負荷がかからずお手軽ですが、一定の数の乱数を作り出してしまった後に、同じ乱数を繰り返してしまうという「周期性」の問題と、乱数がほどよくバラけてくれない「均等性」の問題が発生してしまいます。

 今回、クリントンさん vs トランプさんの投票を、なんやかんやで、1兆回ほどやってみたのですが、そのシミュレーション結果から、乱数の発生に偏りがあることに気が付きました。これはrand()は、2の31乗回で、同じ乱数を繰り返し発生してしまうからです。

 2の31乗とは、約21億です。これは、日常的には、十分に大きな数だと思いますが、1回のシミュレーションで約3億(人分)の乱数を消費するので、(ちょっと乱暴な話ですが)7回目には同じ乱数のパターンを再利用することになってしまうのです。

 1兆回の投票に対しては、同じ乱数パターンを1400億回も繰り返し使うことになり、結果、同じパターンの投票が繰り返されるだけ、という、なんとも無駄なことをしてしまっていたのです。


 そこで、私は今回、松本眞さんと西村拓士さんが考案されたメルセンヌ・ツイスタという乱数生成方式を試してみました。これもrand()と同じように「周期性」があるのですが、その周期がものすごく長いのです。

 メルセンヌ・ツイスタの周期は「2の19937乗」=「10の6001乗」です。これは宇宙の誕生から現在までの時間(秒数)を、10の5983乗回繰り返しても、まだ一巡もできないという超長期の周期性を持ち、事実上、周期性のことは忘れてしまっても良い、というくらい、優れた乱数を生成します。この乱数に切り替えたことで、私のシミュレーションは、妥当な結果を出力するようになりました。

 ―― と、ここまでが前振りです。

 話はいきなり変わりますが、1990年代、金融の世界では、複雑化した金融商品やリスクの計算のために、乱数を用いたシミュレーションが必要となってきていました。

 そんな時、乱数の生成を、従来の100倍ものスピードで生成するソフトウェアが売り出されました。ところが、その価格が、なんと1億円だったのです*)

*)「NHKスペシャル マネー革命〈第2巻〉金融工学の旗手たち」(相田洋・茂田善郎 NHK出版 1994年)

 この本の中に、どっかの銀行の研究部門の研究員(だったかな?)が、金融商品のシミュレーションをするために、このソフトウェア購入の提案をした、という話が出てきます。

 そのソフトウェアの内容を聞かされた重役は「デタラメな数字を出すソフトウェアになんぞに1億円も出せるか!」と一喝して、その提案を却下したそうです。


 しかし「デタラメ」を作ることは、結構難しいのです。なぜなら、一見「デタラメ」に見えている事象であっても、ねちっこく分析し、解析をし続けると、一定の法則が見えてきてしまうものだからです(例えば、このコラムのページなど)。

 ですから、「デタラメ」を極めるのであれば、誰が、どこから、どのような解析をしても、―― たとえ、世界最高性能のスーパーコンピュータを持ち込んできたとしても ―― その関連性を絶対に見つけられない ―― というものでなければなりません。

 そのような「究極のデタラメ」(あるいは、「限りなく究極に近いデタラメ」)を使わないと、新しい金融商品の正確な評価はできないからなのですが、―― しかし、まあ、その銀行の重役が、その「デタラメ」の意義を理解できなかったことは仕方がないのかなぁ、とも思えます。

 それこそ、合衆国大統領選挙の投票を1兆回も繰り返そうとする物好きでもなければ、この感覚を理解するのは無理だろう、と思えるのです。

⇒「Over the AI ――AIの向こう側に」⇒連載バックナンバー

次回の掲載をメールで受け取る



Profile

江端智一(えばた ともいち)

 日本の大手総合電機メーカーの主任研究員。1991年に入社。「サンマとサバ」を2種類のセンサーだけで判別するという電子レンジの食品自動判別アルゴリズムの発明を皮切りに、エンジン制御からネットワーク監視、無線ネットワーク、屋内GPS、鉄道システムまで幅広い分野の研究開発に携わる。

 意外な視点から繰り出される特許発明には定評が高く、特許権に関して強いこだわりを持つ。特に熾烈(しれつ)を極めた海外特許庁との戦いにおいて、審査官を交代させるまで戦い抜いて特許査定を奪取した話は、今なお伝説として「本人」が語り継いでいる。共同研究のために赴任した米国での2年間の生活では、会話の1割の単語だけを拾って残りの9割を推測し、相手の言っている内容を理解しないで会話を強行するという希少な能力を獲得し、凱旋帰国。

 私生活においては、辛辣(しんらつ)な切り口で語られるエッセイをWebサイト「こぼれネット」で発表し続け、カルト的なファンから圧倒的な支持を得ている。また週末には、LANを敷設するために自宅の庭に穴を掘り、侵入検知センサーを設置し、24時間体制のホームセキュリティシステムを構築することを趣味としている。このシステムは現在も拡張を続けており、その完成形態は「本人」も知らない。



本連載の内容は、個人の意見および見解であり、所属する組織を代表したものではありません。


前のページへ 1|2|3|4|5|6|7|8|9       

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

RSSフィード

All material on this site Copyright © 2005 - 2017 ITmedia Inc. All rights reserved.
This site contains articles under license from UBM Electronics, a division of United Business Media LLC.