【分析】関係なしが最も多い意外な展開! 位置情報とツイート内容の関係 by Twitter4J その15
2012-08-22 (水) 23:25 約173万ツイート分析編
※ツイッター分析シリーズの目次はこちら。
約173万ツイート(日本語のみ)を使ったTwitterのツイートの分析のその15です。
今回はその10で課題としていた位置情報付きツイートの位置情報とツイート内容の関係について詳しく見ていきます。
<使用データ> →詳細はその1
期間:2012/05/17(木)0:00~20(日)23:59 の4日間
ツイート数:172万5212 ツイート(日本語のみ)
位置情報とツイート内容の関係
その10と11ではGPS情報(位置情報)付きツイート数は人口(昼間人口)と相関が強いことが分かりました。
しかし、わざわざ位置情報を付けているのは普通のツイートとは異なる何か特別な意味があると考えられます。
なぜこのような結果となるのかを検証するために位置情報付きのツイートの内容を見ることにしました。
分類方法
位置情報付きツイートの内容からツイート自体が位置を意識したものかで分類しました。できれば自動的にやってくれるようなシステムがあればよかったのですが、現在の技術(テキストマイニング技術)ではお堅い文章しか解析できず、ツイートのような型の崩れた内容に対しては無理なようです。
そのため、てぃー自らが3047ツイートすべてに目を通して分類しました。
機械がやるよりはるかに精度が高いのです。
かなりの力技になりました!(自分で自分を褒めてみる^^)
当初は特徴のある時間帯のツイートのみをする予定でしたが、やっている最中にテンションが上がってきてしまい(いわゆるランナーズハイ)、全体の3分の1だけ、いや半分まで、ええぃ全部やってしまえ!と結局全部やってしまいました。
分類方法は次の表のようにしました。
<分類の例>

まず位置情報サービスの場合は本文からその他は緯度経度情報からどの位置からの情報か判断しました。
例ではレストランとなります。
このときツイートの内容が「おいしい」ならばその人がそのレストランで食事をしているという位置を意識したツイートなり、レストランであることから分類を「飲食店」としました。
一方、ツイートの内容が「あらら」という位置を意識していないツイートの場合はこの分類を「関係なし」としました。
また、ツイートの内容が割引サービスなどの店舗情報であった場合では位置を意識したツイートですがその人がその場所にいることを主張しているわけでなくその地点の情報であるため、分類は「地点」としました。
このような方法で分類を作成していきました。
位置情報とツイート内容の関係
結果は次のようになりました(上位30位)。
関係なしが1位で33.51%を占めました。
2位以降では駅、飲食店、商業施設など日常利用する場所となりました。
イベント会場、テーマパークなどイベント、観光地からのツイートもあることが分かりました。
位置情報とツイート内容の関係
次に人口との相関との関係を見るため、都道府県(上位6位)別で位置情報(上位20位)とツイート内容の関係をグラフにしました。(クリックで拡大)

大都市圏では関係なし、駅、飲食店、商業施設といった日常利用する場所からのツイートが多く、またイベント会場、テーマパークといったイベント、観光地からも多いということわかりました。
つまり大都市圏でのツイートは関係なし、日常利用する場所のみでなく、イベント、観光地からのツイートも多いため、全体的に見て位置情報付きツイートは人口と強い相関となることが分かりました。
時間帯別の位置情報とツイート内容の関係
時間帯別の位置情報とツイート内容の関係のグラフは次のようになりました。
ツイート内容は上位10位まではすべて、その他はイベント関係とそうでないものに分けています。
(クリックで拡大)




木曜・金曜は似た傾向となりました。
関係なし、駅など上位のものが大部分を占めています。
特に朝は駅、昼は飲食店、夜は関係なし、深夜は地点が多いことが分かりました。
一方、土曜・日曜は似た傾向となりました。
駅は9時以降増加し、商業施設・道路が多かったです。
イベント関係(イベント会場、その他イベント関係)は午前に多くその後減少します。
このツイート内容は「今イベント会場に向かっている」「イベント会場に着いた」「今からコンサートが始まる」といったもので、イベントが始まるまではツイートはありますがイベントが始まるとイベントに集中するため(あるいはケータイ禁止のため)ツイートが減るということが考えられます。
また道路についても「今イベント会場に向かっている」といった内容のものが多くこちらも同様の理由と考えられます。
今回のまとめ
まとめると次のようになります。
・位置情報と関係のない内容のツイートが1位
→ユーザはツイートに位置情報が付いていることに気付いていない?
→特別な時に位置情報を付けるのではなく、ふだんから付けている
・駅、飲食店、商業施設など日常使う場所からのツイートが多く、
ライフログ・ポイント取得としての性格が強い
→位置情報付きでも人口の多い都市圏のツイートが多くなる
→イベントや観光地からのツイートはあるが都市圏がほとんどで
他の地域からは少ないため埋もれしまう
予想外のおもしろい結果となりましたね!
↓この記事が参考になったら拍手、ツイート、いいね、はてブ、いずれかをお願いします。今後のブログ作りに役立てたいので。
- 関連記事
-
- 【分析】関係なしが最も多い意外な展開! 位置情報とツイート内容の関係 by Twitter4J その15 (2012/08/22)
- 【分析】位置情報サービスが目立つ! GPS情報(位置情報)付きツイートのTwitterクライアント(アプリ)別、曜日別、時間帯別ランキング by Twitter4J その14 (2012/08/21)
- 【分析】ツイートの種類別(リツイートなど)の利用アプリ(クライアント)の機器別での割合(シェア) by Twitter4J その13 (2012/07/01)
- 【分析】ツイートの種類別(リツイート、リプライ(返信)、ハッシュタグ・リンク)の割合(シェア) by Twitter4J その12 (2012/06/30)
- 【分析】今度は東京都をマッピング! GPS情報(位置情報)付きツイートの分布(東京都) by Twitter4J その11 (2012/06/27)