メディア
特集:IoTがもたらす製造業の革新〜進化する製品、サービス、工場のかたち〜
連載
» 2016年08月29日 11時30分 公開

Over the AI ――AIの向こう側に(2):我々が求めるAIとは、碁を打ち、猫の写真を探すものではない (7/9)

[江端智一,EE Times Japan]

読まなくても内容把握? テキストマイニング

 では、ここからは後半になります。

 前回お約束した通り、後半は、「私の身の回りの出来事」を使った、「数式ゼロ」のAI解説を試みてみたいと思います。

 今回は、前半の“人工知能”の解説記事”の分析で使ったテキストマイニングについて説明したいと思います。

 「テキスツマイニングは“人工知能”なのかどうか」の判定については、前回の『江端AIドクトリン』に基づき、「江端が『AI』と思ったものであれば、誰がどう反論しようが、それはAIである」で押し通します。

 テキストマイニングの効果を、身もフタもなく説明すれば、

「上司から読んでおくように言われた、膨大な資料(机の上に30cm以上も積まれた)を、自分では一行も読まず、全部コンピュータに読ませて、それなりに内容を把握するもの

でよいと思います。

 さらに、テキストマイニングの機能を、これ以上もなく乱暴に説明するのであれば「文章を分解して、登場する単語の数をカウントし、その単語の関係を調べているだけ」と言い切ってもいいです。

 「え? それだけ?」と思われるかもしれませんが、これだけのことが、結構侮れないんです。

 次に、これらの単語の出現パターンについて統計処理をします(ここまでの処理なら、フリーソフトや、ネット上にも無料の解析サイトがあります(参考)。

 では、ここから、本コラムの前半をテキストマイニングで解析した結果を図示していきます。

 以下の図は、登場する単語を数え上げたものです。

 なお、今回のコラムでは、NTTデータ数理システムのテキストマイニングツール「Text Mining Studio(TMS)」を利用しています。以下は、TMSで、「私が使い倒している機能」を中心に説明致します。

(1)かかり受け頻度解析

 単なる単語の頻度だけでなく、単語と単語のかかり受けの頻度情報も調べてくれます。本コラムの前半の内容からは「人工知能ー共存」「絶望ー相転移」「ナンシーー作る」などが発見されます。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.