【分析】関係なしが最も多い意外な展開! 位置情報とツイート内容の関係 by Twitter4J その15


※ツイッター分析シリーズの目次はこちら

約173万ツイート(日本語のみ)を使ったTwitterのツイートの分析のその15です。
今回はその10で課題としていた位置情報付きツイートの位置情報とツイート内容の関係について詳しく見ていきます。

<使用データ> →詳細はその1
期間:2012/05/17(木)0:00~20(日)23:59 の4日間
ツイート数:172万5212 ツイート(日本語のみ)



位置情報とツイート内容の関係


その10と11ではGPS情報(位置情報)付きツイート数は人口(昼間人口)と相関が強いことが分かりました。
しかし、わざわざ位置情報を付けているのは普通のツイートとは異なる何か特別な意味があると考えられます。
なぜこのような結果となるのかを検証するために位置情報付きのツイートの内容を見ることにしました。


分類方法
位置情報付きツイートの内容からツイート自体が位置を意識したものかで分類しました。
できれば自動的にやってくれるようなシステムがあればよかったのですが、現在の技術(テキストマイニング技術)ではお堅い文章しか解析できず、ツイートのような型の崩れた内容に対しては無理なようです。
そのため、てぃー自らが3047ツイートすべてに目を通して分類しました。
機械がやるよりはるかに精度が高いのです。
かなりの力技になりました!(自分で自分を褒めてみる^^)
当初は特徴のある時間帯のツイートのみをする予定でしたが、やっている最中にテンションが上がってきてしまい(いわゆるランナーズハイ)、全体の3分の1だけ、いや半分まで、ええぃ全部やってしまえ!と結局全部やってしまいました。

分類方法は次の表のようにしました。
<分類の例>


まず位置情報サービスの場合は本文からその他は緯度経度情報からどの位置からの情報か判断しました。
例ではレストランとなります。
このときツイートの内容が「おいしい」ならばその人がそのレストランで食事をしているという位置を意識したツイートなり、レストランであることから分類を「飲食店」としました。
一方、ツイートの内容が「あらら」という位置を意識していないツイートの場合はこの分類を「関係なし」としました。
また、ツイートの内容が割引サービスなどの店舗情報であった場合では位置を意識したツイートですがその人がその場所にいることを主張しているわけでなくその地点の情報であるため、分類は「地点」としました。

このような方法で分類を作成していきました。


位置情報とツイート内容の関係
結果は次のようになりました(上位30位)。



関係なしが1位で33.51%を占めました。
2位以降では駅、飲食店、商業施設など日常利用する場所となりました。
イベント会場、テーマパークなどイベント、観光地からのツイートもあることが分かりました。


位置情報とツイート内容の関係
次に人口との相関との関係を見るため、都道府県(上位6位)別で位置情報(上位20位)とツイート内容の関係をグラフにしました。
(クリックで拡大)



大都市圏では関係なし、駅、飲食店、商業施設といった日常利用する場所からのツイートが多く、またイベント会場、テーマパークといったイベント、観光地からも多いということわかりました。
つまり大都市圏でのツイートは関係なし、日常利用する場所のみでなく、イベント、観光地からのツイートも多いため、全体的に見て位置情報付きツイートは人口と強い相関となることが分かりました。


時間帯別の位置情報とツイート内容の関係


時間帯別の位置情報とツイート内容の関係のグラフは次のようになりました。
ツイート内容は上位10位まではすべて、その他はイベント関係とそうでないものに分けています。
(クリックで拡大)









木曜・金曜は似た傾向となりました。
関係なし、駅など上位のものが大部分を占めています。
特に朝は駅、昼は飲食店、夜は関係なし、深夜は地点が多いことが分かりました。

一方、土曜・日曜は似た傾向となりました。
駅は9時以降増加し、商業施設・道路が多かったです。
イベント関係(イベント会場、その他イベント関係)は午前に多くその後減少します。
このツイート内容は「今イベント会場に向かっている」「イベント会場に着いた」「今からコンサートが始まる」といったもので、イベントが始まるまではツイートはありますがイベントが始まるとイベントに集中するため(あるいはケータイ禁止のため)ツイートが減るということが考えられます。
また道路についても「今イベント会場に向かっている」といった内容のものが多くこちらも同様の理由と考えられます。


今回のまとめ


まとめると次のようになります。

・位置情報と関係のない内容のツイートが1位
 →ユーザはツイートに位置情報が付いていることに気付いていない?
 →特別な時に位置情報を付けるのではなく、ふだんから付けている
・駅、飲食店、商業施設など日常使う場所からのツイートが多く、
 ライフログ・ポイント取得としての性格が強い
 →位置情報付きでも人口の多い都市圏のツイートが多くなる
 →イベントや観光地からのツイートはあるが都市圏がほとんどで
  他の地域からは少ないため埋もれしまう


予想外のおもしろい結果となりましたね!


↓この記事が参考になったら拍手、ツイート、いいね、はてブ、いずれかをお願いします。今後のブログ作りに役立てたいので。
関連記事

コメントの投稿

非公開コメント

プロフィール

てぃー

Author:てぃー
詳しい自己紹介:こちら
Twitter:@teapipin


follow us in feedly 
にほんブログ村 IT技術ブログへ にほんブログ村 PC家電ブログへ
現在の閲覧者数:

ブログ内検索
今日のアクセス数の多い記事
カレンダー

07月 | 2017年08月 | 09月
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
過去記事ダイジェスト
お知らせ

ツイッター分析の分析結果が新潟大学教育学部の論文に引用
教育の実証研究の場でも高く評価!

ツイッター分析の分析結果が和歌山大学防災研究教育センターの論文に引用
防災の研究において評価!

2015年版ツイッター分析(世界編)が始動!
今回は世界の国別・言語別ツイートを分析!

ツイッター分析の分析結果が慶應義塾大学有名教授の研究論文などに引用
文系の研究までも制覇!

Interval Timer EX
有名雑誌「Mac Fan 2015月2月号」に「インターバルタイマーEX」が3度目の掲載!ポモドーロテクニックに有効!

自作Macアプリ3部作が2014年 Vector 年間ダウンロードランキング Mac トップ100にすべてランクイン

TimeCalcを公開しています!
時間計算、年齢計算、学歴欄作成など。

ツイッター分析の分析結果が人工知能の研究に!
ブログが学会発表で引用されました。

今まで開発したiPhoneアプリのソースコードを公開しています!
勉強に役立ててください。


2013年 Vector 年間ダウンロードランキング Mac トップ100に「デジカメ変更日を撮影日に一括変更 for Mac」と「インターバルタイマーEX」がランクイン

Interval Timer EX
有名雑誌「Mac Fan 2013月4月号」に「インターバルタイマーEX」が2度目の掲載!!

リアルタイムツイッター地図
リアルタイムツイッター地図を公開しています!
位置情報付きツイートをリアルタイムに表示します。

新たなツイッター分析としてイベントツイート分析を行っています!

2012年8月1日(水)開催の「Twitter勉強会」で発表
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack from teapipin


Interval Timer EX
有名雑誌「Mac Fan 2012月3月号」に「インターバルタイマーEX」が掲載!!



 

はてなブックマークの人気記事
ツイート&いいね!ランキング