メディア
連載
» 2016年11月24日 11時30分 UPDATE

世界を「数字」で回してみよう(36) 人身事故:飛び込みにまつわる「6つのなぜ」に新たな仮説が続々? (8/10)

[江端智一,EE Times Japan]

検索キーワード別に解析してみた

 では、ここからは、テキストマイニングツール(TMS)を使った解析結果を示していきます。なお、TMSには、検索キーワード自身は解析対象の除外とするように設定しました。検索キーワード自体で、解析結果を引っ張られないようにするためです。

 では、個別の解析結果をご紹介します。

【ケース1】キーワード:“小田急”+”人身事故”

 このメッセージでは、キーワードに「人身事故」を含んでいることがポイントです。

 まず、メッセージの9割がリツイートであり、同じメッセージが重複していることが理由でもあると思いますが、メッセージの内容は、基本的には「リアルタイムのニュース」を目指していることが明かです。

 また、TMSの解析結果からは、自分の置かれている状況の記載がほとんどであり、自分の感情の記載のメッセージは少ないことが分かります。

【ケース2】キーワード:"小田急"+"飛び込み"

 こちらは、キーワードに「飛び込み」という言葉が入っている点が、上記の「人身事故」とは異なります。

 「飛び込み」を使っているメッセージは、事故の原因に言及するものが多く登場し、そのため、メッセージの中には(ネガティブな)感情を示す言葉が登場し始めています。

 ただ、登場するフレーズは文章の態を成しており、使われている単語も簡潔で明解なものが使用されていることが分かります。

【ケース3】キーワード:"小田急"+"死ね"

 こちらは、キーワードに「死ね」という言葉が入っている点で、上記の2つと決定的に異なります。

 上記のTMSの解析結果からも明らかなように、「死ね」という言葉を使うと、論理展開や、自分の心情を説明する必要がなくなり、それ意外の感嘆表現を伴う形容句・形容詞、副詞、名詞が登場してこないことが分かります。

 これは、怒りに心身を支配されている時の典型的な心理状態で、私には、その気持ちが、とてもよく理解できます

 ですから、メッセージ事態も、こんな感じの品のないものになっています。しかし、繰り返しますが、このようなメッセージは本当に少なく、希少的価値があると言っても良いほどです。

 なお、私も、負けず劣らず、性格も根性も悪いので、このようなメッセージを残した人のほぼ全員のタイムライン(TL)を、過去にさかのぼって読み倒しました(この結果について、この連載のテーマから外れますので、今回これ以上の言及は避けます)。

 データアナリストの1人として、「たとえ匿名性の高いSNSといえども、自分の発言には注意した方が良い」とだけは、申し上げたいと思います。ひとたび、あなたが、性格や根性が悪いデータアナリストに目を付けられれば、サンプルにされ、真っ裸に解析されかねないことを、あらかじめ申し上げておきたいのです。国家権力が、その気になれば、もっと簡単に本人を特定(以下、自粛)。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from UBM Electronics, a division of United Business Media LLC.