Myrmecoleon in Paradoxical Library. ニコニコ分室 RSSフィード

2007-11-24

ニコニコ動画 カテゴリタグ別動画 再生数・コメント数分布 1 動画数・中央値 01:53 ニコニコ動画 カテゴリタグ別動画 再生数・コメント数分布 1 動画数・中央値 - Myrmecoleon in Paradoxical Library. ニコニコ分室 を含むブックマーク はてなブックマーク - ニコニコ動画 カテゴリタグ別動画 再生数・コメント数分布 1 動画数・中央値 - Myrmecoleon in Paradoxical Library. ニコニコ分室 ニコニコ動画 カテゴリタグ別動画 再生数・コメント数分布 1 動画数・中央値 - Myrmecoleon in Paradoxical Library. ニコニコ分室 のブックマークコメント


前に書いた再生数の分布等をさらに詳しく調べてたところ,ある程度まとまったので書いてみる。

あとコメント数の方も面白いなあ,とかも思ってそっちもとってみた。

あくまである時点の数値ですが,たぶんしばらく大変動しないと思うので参考にできると思う。


ソース


ニコニコ動画の各タグ検索の結果。

データ取得に時間が掛かるので,結局11月25日の13時~19時くらいまでかかってます。このため動画数については時間帯別のズレがありますが,分布自体はそれほど大幅に変更しないはず*1


作業


さすがに面倒なのでスクリプト組んでガリガリ取得。

タグ検索さんを怒らせないように取得の幅をわりと広めにとったので,けっこう時間かかりました。*2

ちなみにデータとしては,各カテゴリタグについて,動画の総数,再生数・コメント数の最大値,中央値のほか,パーセンタイルを0.1,1,5~95(10,15,20というように5刻み),99,99.9の刻みで取得してます*3。今回は使いませんが,あとでそのへんの細かいとこの数字も公開する予定。


結果


ちゃらっとまとめると以下のような感じ。


カテゴリタグ動画数最大値(再生)最大値(コメント)中央値(再生)中央値(コメント)コメント中央値/再生中央値
音楽647112,552,7061,563,438945475.0%
エンターテイメント320861,316,603891,4611225836.8%
アニメ86300847,571816,21415331107.2%
ゲーム162702949,453323,4011064767.1%
動物7690781,634219,283678345.0%
アンケート1536523,788891,4612004194797.2%
ラジオ10050438,999132,333599254.2%
スポーツ15994788,33580,8051029575.5%
政治2588234,932146,009100311511.5%
チャット271357,6362,852,996243631012.7%
科学2078182,878144,4801273745.8%
歴史2933266,992167,4461007747.3%
料理1721325,128177,927111115714.1%
自然1435289,017133,767473306.3%
日記2197278,653733,50213421057.8%
踊ってみた3025786,168176,4521997934.7%
歌ってみた16937884,457302,6411063767.1%
演奏してみた5323634,916104,6502098984.7%
ニコニコ動画講座1509203,6271,215,62416901136.7%
投稿者コメント663193,84833,530351216.0%
台灣1029250,873186,848633416.5%
その他99301,110,7781,475,281886576.4%
テスト5054361,6131,723,846462235.0%
R-1894201,313,369228,9331920774.0%
公式582,557,0841,563,98417661639.2%

各値を見ていくと以下のよう。


動画数


f:id:myrmecoleon:20071125043917j:image:w800


動画数多い順。ゲーム動画大杉。全体の約1/3とか待とうよ。

その他では順当にアニメ,音楽,ちょっと下ってエンタメと四天王(勝手に呼んでるだけ)が並ぶ。

その下。歌ってみた・スポーツが多いのはなんとなく分かるのだけど(人気もあるしランキングにも出るし),次がラジオというのが意外。ゲームもそうだけど続き物が多いからだろうか? その下だとテストカテゴリが妙に多いなとかそれくらい。


ざっと見ればわかるとおり,ほとんどのカテゴリは5000に満たないです。この中では中央値が踊ってみたの3025。これがどのくらいの数かというと,先日ちょうど初音ミクタグが10000個越えて,チーターマンタグがやっと1100越えた,ってぐらい。

特に動画数の少ないカテゴリでは投稿者コメントやチャットなどがあり,このへんはそういうカテゴリがあること自体あまりに認知されてないような気も。


なお,これらのカテゴリの動画数を足しても実は45万くらい(これも実際は重複があるので若干少なくなる)にしかならず,投稿動画全体(左上の数字)の約59万には届きません。

残り約14万の中には,カテゴリタグの付与されてない動画(検索よけのためにタグ自体を抜いている動画も多い)や削除された動画(削除動画はタグ検索には出てこない)が含まれるはず。*4


中央値


再生数およびコメント数の中央値。わりと面白い数字が出てる。

(再生数)

f:id:myrmecoleon:20071125043916j:image:w800


(コメント数)

f:id:myrmecoleon:20071125043915j:image:w800


考察


中央値はいわゆる平均値と同様,ある集団の平均的な性質を読み取るのに用いられる。このため下記のグラフの数字は,おおむね各カテゴリの傾向をあらわすものとして評価できる。


これら中央値の中央値を求めると,再生数では1064,コメント数では76となる。ここから,1000再生でコメントが50~80というぐらいがニコニコ動画の典型的な動画,と考えることができる。比率でみれば再生に対して約7%。


また個別に見るとカテゴリ毎に大きな違いがあることが分かる。たとえばアンケートとチャットは再生数・コメント数とも中央値が高い,特にコメントについては非常に高い(あまりに極端すぎたのでグラフでは切りました)。つまり,再生数・コメント数ともに高い動画が多い。次いで高いものとして公式,ニコニコ動画講座,アニメ,日記があげられる。

逆に両方少ないのが台灣,動物,自然,ラジオ,テスト,投稿者コメント,その他など。意外なことにランキングではよく見る音楽カテゴリもこれらについで低い。

再生・コメントどちらかに特化して高い動画もある。演奏してみた,踊ってみた,R-18などは再生数が高めであるのに対して,コメント数はそれほどでもない。逆に再生に対してコメントが多い傾向なのが料理,政治,歴史などである。

もっとも動画数のあるゲーム,残る四大カテゴリの一つのエンターテイメント,それらについで動画数の多い歌ってみたなどは,再生・コメントのいずれでも比較的全体の中央値に近いあたりに収まっている。これらは比較的平均的な性格といえる。


この傾向は下のように再生数あたりのコメント数の比率を両中央値で出すとわかりやすい。


(コメント数中央値/再生数中央値)

f:id:myrmecoleon:20071125043914j:image:w800


アンケート動画がみてのとおり異常に高いほか,コメント率の多い動画カテゴリとしては,料理,チャット,政治,公式,日記,歴史。逆に低いカテゴリは動物,テスト,音楽,演奏してみた,踊ってみた,ラジオ,R-18となる。


実際には同じカテゴリでも人気のある上位の動画と下位の動画では傾向は異なるだろう。また,同一のカテゴリ内でもコメントに偏る動画と再生に偏る動画はあると思われる。

また,動画数が少ないマイナカテゴリでは母数が多くないため,極端な値が出ていることも考えられる。アンケート,チャットなどのカテゴリが極端な値なのはこのせいかもしれない。

ただし,一定の傾向を読み取るための指標としては,上記の中央値は使用できると思われる。


なお,これらから読み取れる傾向は,単純に人気があるというより,需要(視聴者の視聴回数)と供給(うpされる動画数)のバランスがどうなっているか,というふうに見た方が適切かもしれない。

たとえば演奏してみたや踊ってみたは需要はあるがうpが多くないため,全体的によく再生される傾向にあるが,大して歌ってみたは非常によくうpされるが,それを支える視聴者が少ない(または特定の動画に偏ってる)ため,全体的には再生数が多くない,といったことが推定できる。なぜ演奏してみたの供給が少ないかといえば,要するに歌ってみたよりも必要な技能(楽器の演奏技術等)が多いことが原因だろう。

音楽カテゴリなどは実際にはミリオン級の動画をもっとも抱えてるカテゴリであり,決してみられていないはずはないのだが,中央値をとると上記のようになる。これも需要は常にあるとして,それ以上の供給がされているための結果かもしれない。


以上,各カテゴリの動画数と再生数・コメント数の中央値についてみた。この数字でもある程度のことはわかるが,それぞれのカテゴリの再生数・コメント数の分布を考える場合,もう少し詳細なデータが必要になる。ということで今回はここまでとして,次回そのあたりも含めて書く予定。

*1:以前に取得してたデータと今回取得したデータを比較しても,1%ずつ再生数が増えてるとか程度で大きな変化はありませんでした。

*2:途中でいくつか問題を見つけて(たまに古い検索結果が出てくるとか)そのための修正とかもしてました。

*3:パーセンタイルあたりの話はまた次回

*4:もしかしたら左上の投稿動画数には削除動画が含まれないのかもしれませんが

fladdictfladdict2007/11/26 19:27これ面白いですね。偏差とか、カテゴリ毎のコメント/再生数の相関とかそういうのも期待してます!!