【分析】今度は東京都をマッピング! GPS情報(位置情報)付きツイートの分布(東京都) by Twitter4J その11


※ツイッター分析シリーズの目次はこちら

約173万ツイート(日本語のみ)を使ったTwitterのツイートの分析のその11です。
前回はGPS情報(位置情報)付きツイートを国別、都道府県別の分析のために地図にマッピングしましたが、今回は都道府県別で最も多かった東京都について区市町村レベルで詳しく見ていきます。

<使用データ> →詳細はその1
期間:2012/05/17(木)0:00~20(日)23:59 の4日間
ツイート数:172万5212 ツイート(日本語のみ)



GPS情報(位置情報)付きツイートの東京都の区市町村別ランキングと地図


東京都のGPS情報(位置情報)付きツイート825個について区市町村別ランキングは次のようになりました。
(同順位のものは人口の多い順にしました。0個のものも入れました。)

千代田区が群を抜いて多いですね。
小笠原村硫黄島からのツイートもありました。

次に地理的関係が分かるように合計ツイート数の地図を作成しました。
(離島は範囲に入れられなかったので除いています。)



また、次のように曜日別の地図もアニメーションで作成しました。
変化が分かりやすいですね。


どうやら前回のその10の都道府県別の場合と同じく人口が多いところがツイート数が多そうな感じです。
それを検証するために前回と同様に人口とツイート数で散布図を作成しました。


あららら~。
予想と違って人口とは相関は低いようです。
では何と相関があるのでしょうか?!

上位のものを見直してみると繁華街やビジネス街の地域が多いです。
ということは、普段の人口は住んでいる場所の住所の人口なのでこれでは意味がないようです。
東京は地域によって昼間の人口(昼間人口:ちゅうかんじんこう)と普段の人口(夜間人口)に大きく差があるので注意が必要ですね。
(例えば千代田区は昼間人口が夜間人口の20倍以上になるそうです。→参考:Wikipedia)

では今度は昼間人口とツイート数で散布図を作成しました。



おお!今度は見事に相関が見られました!
東京都のGPS情報(位置情報)付きツイート数は昼間人口が相関していることがほぼ間違いないでしょう。
ここで「ほぼ」としたのは昼間人口は昼間の通勤による人口であり、事実上平日の昼間の人口です。
平日夕方~夜や休日に人が集まるであろう新宿区や渋谷区はこの人口よりも実際はもっと多いのではないかと思われます。
そのような資料があれば新宿区と渋谷区はより散布図で右に移り、より相関が強くなるでしょう。

結局は都道府県の場合と同様に、GPS情報(位置情報)付きツイートであっても普段のツイートの傾向と変わらないことが分かりました。
やはり普通のツイートと同じようなツイートになるのでしょう。


次回の予定とボツにしたネタ


次回はリツイートについて全体分布をざっと見ていけたらと思います。
なお、以下にボツにしたネタをせっかくなので紹介します。


2012/08/22 追記
GPS情報(位置情報)についてさらに分析を進めた内容をその14、その15として書きました。
その14 GPS情報(位置情報)付きツイートのTwitterクライアント(アプリ)別、曜日別、
      時間帯別ランキング
その15 位置情報とツイート内容の関係

 

ボツにしたネタ


実は上で人口とツイート数で相関が見られなかったので見直しのため、区市町村別の曜日別ツイート数で類似性を見ようと階層的クラスター分析を行いました。
木曜~日曜のツイート数の傾向が似ている地域が同じグループになるように樹状図を作りました。
(詳しい説明→クラスター分析とは|市場調査・アンケート調査のマクロミル
(クリックで拡大)



例えば一番下の港区と1つ上の渋谷区は図での距離が近いため傾向が似ている地域ということになります。
逆に一番上の小笠原村と一番下の港区は距離が最も離れているのでもっとも傾向が似ていないということになります。
また似た傾向のものは同じ分岐(節)に含まれることになるので、ある階層で切ればグループ分けすることができます。

今回は下のように(1)のところで階層を分けてみました。
すると3つのグループに分けることができ、仮にA、B、Cグループとしました((2)の部分)。
(クリックで拡大)



下から順にCグループが繁華街やビジネス街の傾向が強いグループ、Bグループがその傾向の準じるグループ、Aグループはその他ということが分かりました。

実際はこのグループ分けは区市町村別ランキングとほぼ同じ並び順となってしまったので途中でこれに気づき、しかも昼間人口と関係がありそうなことが分かってしまったので、このクラスター分析はあまり意味がなくなってしまいました。
傾向を見たのが木曜~日曜と合計5種類の少数の分類だったので仕方ないですね。
もっと分類の数が多ければ使えるツールなんですが。
ということでせっかくなので載せてみました。
読んでいただけてうれしいです。


↓この記事が参考になったら拍手をクリックお願いします。今後のブログ作りに役立てたいので。
関連記事

コメントの投稿

非公開コメント

プロフィール

てぃー

Author:てぃー
詳しい自己紹介:こちら
Twitter:@teapipin


follow us in feedly 
にほんブログ村 IT技術ブログへ にほんブログ村 PC家電ブログへ
現在の閲覧者数:

ブログ内検索
今日のアクセス数の多い記事
カレンダー

07月 | 2017年08月 | 09月
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
過去記事ダイジェスト
お知らせ

ツイッター分析の分析結果が新潟大学教育学部の論文に引用
教育の実証研究の場でも高く評価!

ツイッター分析の分析結果が和歌山大学防災研究教育センターの論文に引用
防災の研究において評価!

2015年版ツイッター分析(世界編)が始動!
今回は世界の国別・言語別ツイートを分析!

ツイッター分析の分析結果が慶應義塾大学有名教授の研究論文などに引用
文系の研究までも制覇!

Interval Timer EX
有名雑誌「Mac Fan 2015月2月号」に「インターバルタイマーEX」が3度目の掲載!ポモドーロテクニックに有効!

自作Macアプリ3部作が2014年 Vector 年間ダウンロードランキング Mac トップ100にすべてランクイン

TimeCalcを公開しています!
時間計算、年齢計算、学歴欄作成など。

ツイッター分析の分析結果が人工知能の研究に!
ブログが学会発表で引用されました。

今まで開発したiPhoneアプリのソースコードを公開しています!
勉強に役立ててください。


2013年 Vector 年間ダウンロードランキング Mac トップ100に「デジカメ変更日を撮影日に一括変更 for Mac」と「インターバルタイマーEX」がランクイン

Interval Timer EX
有名雑誌「Mac Fan 2013月4月号」に「インターバルタイマーEX」が2度目の掲載!!

リアルタイムツイッター地図
リアルタイムツイッター地図を公開しています!
位置情報付きツイートをリアルタイムに表示します。

新たなツイッター分析としてイベントツイート分析を行っています!

2012年8月1日(水)開催の「Twitter勉強会」で発表
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack from teapipin


Interval Timer EX
有名雑誌「Mac Fan 2012月3月号」に「インターバルタイマーEX」が掲載!!



 

はてなブックマークの人気記事
ツイート&いいね!ランキング