【分析】Twitter4Jを使ったTwitterのツイートの分析方法について考えてみた


※ツイッター分析シリーズの目次はこちら


今日も予想通り小雨ぱらつく日でしたね。
明日は晴れるそうですがどうなんでしょう!?


さて、以前から考えているTwitter4Jを使ったTwitterのツイートの分析についてその方法を考えてみました。
てぃーはある出来事が起こったらそれに対するツイートがどんなふうに拡散されるか分析してみたいと考えています。
そのためのツイートの取得ツールとしてTwitter4Jを導入し、必要なプログラムを学びました。
といってもプログラム自体は簡単なもので今までに紹介してきた3種類(4つ)で充分です。

フォロー(フレンド)とフォロワーの片思い・片思われを抽出する方法
検索してその結果を表示する方法
・全ユーザーの公開ツイート(日本のみ)を表示する方法
 (PublicTimelineStreaming APIのsample


一方で残念ながらTwitterにはいろいろと制限があることも分かってきました。

1.1時間当たりの接続回数に上限があるため、対象とするユーザー情報・ツイートは
  数が多い場合はすべてを取得することはまずできない。
2.全ユーザーの公開ツイートはStreaming APIを使えば接続回数に制限はないが、
  一般には約1%の抽出したデータしか使えない。
3.全ユーザーの公開ツイートはStreaming APIではそれまでのツイートは取得できない。
4.位置情報はほとんどの人が情報がない(当然ですが)。



データの蓄積について


上の1.3.についてです。
Twitterからは蓄積データは取得できないので工夫しないといけないですね。
検索で取得できるデータも恐らく最近2週間程度の情報なのでふだんからデータを蓄積しておく必要がありそうです。
それでも1ユーザでは1時間当たりの接続回数に上限があるため、多くのデータを取得するには複数のユーザで常時接続をし続けないといけないですね。
そのためには普通のクライアントのPCではなく、サーバーでプログラムを走らせ続けるのがいいでしょう。

ツイッターはAPIを公開しているので世にはいろいろなツイッターのアプリがありますが、ウェブサービスのものが多いのはこのためでしょうね。
つまりユーザーのPCでの実行では接続回数の上限を超えてしまうので、ウェブサービスにして事前にサーバーに蓄積しておいたデータを使うことで接続上限を回避して実行を可能にしているのでしょう。

サーバー上でプログラムを常時走らせておくのはお金とちょっとした労力があればできますが、それだけに力を注いでしまうと単なる創造性のないプログラマで終わってしまいますね。。。
このブログで行うべきは創作活動なのでこのことを忘れないようにしないといけませんね^^


位置情報について


上の4.についてです。
各ツイートやプロフィールに位置情報を入れられますがふつうは入れている人はいません。
当たり前ですね。

それでも次のようにいくつかのサービスではツイートと位置情報を絡めたものがあります。

あなたのまわりのカゼ話題度をチェック! カゼミルプラス
http://kazemiru.jp/


インフルくん
http://mednlp.jp/influ/


これらはどのようにして位置情報を取得しているのでしょうか?!
単にツイートに含まれている位置を表す単語から判断しているのでしょうか?
今はこれらのツイートの話題が少ないので調べられませんでしたが、今後はさらに深めて調べていきたいと思います。


↓この記事が参考になったら拍手をクリックお願いします。今後のブログ作りに役立てたいので。
関連記事

コメントの投稿

非公開コメント

プロフィール

てぃー

Author:てぃー
詳しい自己紹介:こちら
Twitter:@teapipin


follow us in feedly 
にほんブログ村 IT技術ブログへ にほんブログ村 PC家電ブログへ
現在の閲覧者数:

ブログ内検索
今日のアクセス数の多い記事
カレンダー

04月 | 2017年05月 | 06月
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -
過去記事ダイジェスト
お知らせ

ツイッター分析の分析結果が和歌山大学防災研究教育センターの論文に引用
防災の研究において評価!

2015年版ツイッター分析(世界編)が始動!
今回は世界の国別・言語別ツイートを分析!

ツイッター分析の分析結果が慶應義塾大学有名教授の研究論文などに引用
文系の研究までも制覇!

Interval Timer EX
有名雑誌「Mac Fan 2015月2月号」に「インターバルタイマーEX」が3度目の掲載!!ポモドーロテクニックに有効!

自作Macアプリ3部作が2014年 Vector 年間ダウンロードランキング Mac トップ100にすべてランクイン

TimeCalcを公開しています!
時間計算、年齢計算、学歴欄作成など。

ツイッター分析の分析結果が人工知能の研究に!
ブログが学会発表で引用されました。

今まで開発したiPhoneアプリのソースコードを公開しています!
勉強に役立ててください。


2013年 Vector 年間ダウンロードランキング Mac トップ100に「デジカメ変更日を撮影日に一括変更 for Mac」と「インターバルタイマーEX」がランクイン

Interval Timer EX
有名雑誌「Mac Fan 2013月4月号」に「インターバルタイマーEX」が2度目の掲載!!

リアルタイムツイッター地図
リアルタイムツイッター地図を公開しています!
位置情報付きツイートをリアルタイムに表示します。

新たなツイッター分析としてイベントツイート分析を行っています!

2012年8月1日(水)開催の「Twitter勉強会」で発表
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack from teapipin


Interval Timer EX
有名雑誌「Mac Fan 2012月3月号」に「インターバルタイマーEX」が掲載!!



 

はてなブックマークの人気記事
ツイート&いいね!ランキング