Skip to content

makecolors/tweetanalysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

始めに

非公式リツイート(以下、非公式RTとする)とはTwitterクライアントにおいてリツイートの機能を利用した際に生成される文章である。リツイートは他人の文章を拡散し認知してもらおうという目的から作られている。日本では2010年1月22日以前まで、本アプリであるTwitterはリツイート機能を実装していなかった。そのため広く知らせたいメッセージが存在したときに拡散する手段が公式的に存在していなかった。そのためTwitterクライアントにおいてその機能(リツイート)を実装しようという試みがあった。現時点ではTwitterのリツイート機能は実装化されている。今回は非公式RT(RT)をリスト形式で取り出す。途中経過のデータ加工をする必要は特にない。 目的

Twitter上でどのように情報が伝播しているのかを分かりやすい形に表現することで人とのつながりを可視化する。 ファイルの構成 処理用プログラム

TweetAnalysis.java [処理の中心となるファイルです.木構造の形でRTの関係を出力します(RTRelation.dat)]
TweetClass.java [RT関係を作るためのオブジェクト設定とメソッド群を用意しています]
Def.java [プログラム中で変更されないもので複数ファイルで使用される変数を管理します]
CreateHashMap.java [256個に分割したハッシュ表(/hash/xx.dat)を作成します]
cut.sh [元データ(test.dat)からscreenNameとツイート内容だけを抜き出し、ファイルを出力します(test-cut.dat)] 

テストデータ

test.dat [全ての情報が入っている元データ]
test-cut.dat [screenNameとツイート内容のみを切り出した加工データ] 

途中データ

hash/xx.dat [テキストをハッシュ化(keyとする)して256個の分割されたファイルにそれぞれ保存する.valueは元データの位置となっている] 

結果データ

RTRelations.dat [RTの関係を出力した最終結果.木構造になっています]
Debug.dat [RT部分でちゃんと分割できているかどうかをチェックするためのファイル] 

プログラムの使い方

ここではテストデータを用いた流れを説明する.

Def.javaで作業パスを設定する.
Twitterの元データ(test.dat)をcut.shを使って、test-cut.datを作成する.
CreateHashMap.javaを実行してhashフォルダ(256個のxx.datファイル)を作成する.
TweetAnalysis.javaを実行してRTRelations.dat(結果ファイル)とRTDebug.dat(デバッグ用ファイル)を作成する. 

実際にはtest.datの代わりに2011_03_XX.datファイルを用いる。

About

ツイート解析プログラム

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages