【にじさんじ】ライバーのネットワーク作ってみた【コメント分析】

【にじさんじ】ライバーのネットワーク作ってみた【コメント分析】

にじさんじライバーの配信コメントを分析して、ライバー間のコメントの雰囲気の近さを地図にしてみました。vtuberの統計分析だと視聴回数とかスパチャ額のランキングが多くて、それはそれで面白いとして、自分は競争的なものじゃない分析したいなって思ったり。だから今回も、コメントの量は関係のないようにしてたりします。→次は海外勢を混ぜて、期間も伸ばしてやってみようかと。あと笹は草に変換しますね。※緑仙のチャンネルが2つなのに気づくの遅れたため、地図に2つあります。※メンバーシップのスタンプは解析からは排除してます。ーーーーーーーーーーーー分析手法・22年の8月から10月の3か月間のコメントについて、10回以上の配信やプレミア公開をしたライバーを対象・チャットを収集し、形態素解析を行い単語の頻度を算出。頻度は出現回数÷コメント総数。(なお単語は名詞、動詞、副詞、感動詞、!、?など)・集めた単語のうち頻度が0.01%未満のものはデータの軽量化のためカット。この時点で一人当たり2000〜2500語、全員で約8000語の単語が集まった。・TF-IDFを使って特徴的な単語を増幅(IDFは1+log)、ライバー2人の間のcos類似度Θを算出し、これで近さR=10-Θ/9をとる。・近さRの値が全体的に密集していたので、(2^R)/200で近さの差を広げた。・ライバーAと近い順にその他のライバーB〜Zを並べて、一番近いライバーがすごい近かったら近さ上位6人と線をむすぶ。まあまあ近いなら上位4人、そこまでなら上位2人、近いライバーがいないなら1人と線を結ぶ。ライバーAを変えて全部やる。(だからネットワークで結ばれているのは近い上位だけ)・結ぶライバーのセットとその近さがまとまったので、これをソフトGephiで自動でネットワークを可視化した(パラメータを微調整していい感じにばらけさせる)(このとき全ライバーが線で結ばれているとカオスな絵になる)ーーーーーーーーーーーー22.12.07_1万再生参考:にじさんじの配信者の類似性をチャットデータからネットワークグラフにして分析する https://qiita.com/fufufukakaka/items/9f73389e0ea0ba95307cBGM: vivid (igrek-uさん)編集: aviutl, ゆっくりMovieMaker4解析: python (library: jamone→janome)可視化ソフト:gephi

http://www.nicovideo.jp/watch/sm41452463