Hatena::ブログ(Diary)

小人さんの妄想 このページをアンテナに追加 RSSフィード Twitter

2014-04-16

インターネットは一強多弱

・ECショップにおける商品ごとの売上状況、ブログアクセス数、動画再生数などを調べると、

 インターネットが本質的に一強多弱の世界であることが窺い知れる。

・教訓:ほんの一握りの成功事例を、全体像であると勘違いしないこと。


■ 事例1: 大手ECショップ

インターネット上のECショップって、どの程度売れているのだろう?

ふとした興味から、調べてみました。

とは言え、売上状況を全面的に公開しているECショップは、ほとんどありません。

そんな中、個々の商品の価格と販売数を公開しているECショップがありました。

「公開している」ということと、以下のデータから、どこのショップか察しがつきそうですが、

ここでは匿名の大手ECショップということで話を進めます。

○ 大手ECショップ

ソフトウェア電子書籍等のコンテンツ販売(おそらく該当業界の最大手)

・商品点数:約9万点 (調査時点で90851点)

・調査日:2014/03/08


○ 商品ごとの販売数状況

このショップ上で販売数No.1の商品は、約3万件売れていました。(31087件)

販売数の様子をヒストグラムにすると、こうなりました。

f:id:rikunora:20140416153402p:image

このグラフは、横軸に販売数(1区分=1000件)、縦軸に商品点数を描いたものです。

一部のヒット商品が突出している様子がよく分かります。

全商品90851点のうち、83536点は販売数1000件に達していません。

これは全商品の約 92%に相当します。

10位の販売数は 19083件、10位までで全販売数の 0.7% を占めていました。

100位の販売数は 9304件、100までで全販売数の 4% を占めていました。

1件も売れていない商品は、1444点ありました。

1件だけ売れている商品は、1622点ありました。

2件目以降は販売数が単調に減少しているので、少なくとも1件はテスト等で購入しているものと想像できます。

f:id:rikunora:20140416153437p:image


○ 商品ごとの売上状況

では、販売数ではなく、商品ごとの売上金額で見た場合はどうなるか。

f:id:rikunora:20140416153543p:image

売上で見ても、大局的な傾向は変わりません。

上のグラフで、もはや見ることはできませんが、右端に1位があります。

ごく一部のヒット商品が突出し、下位の大多数は売上にほとんど貢献していません。


一般に商品と売上の関係は「ベキ乗則」に従うと言われています。

パレートの法則、80:20の法則、などとも言われています。

上の売上データを両対数プロットすると、こうなりました。

f:id:rikunora:20140416153637p:image

横軸は商品の順位(左側が1位)、縦軸は売上(それぞれ対数)です。

グラフを見ると、中位あたりまではベキ乗則(ほぼ直線)と言っても良いでしょうが、

下位の商品群については、直線からの落ち込みが目立ちます。

全体としては、対数正規分布に従っているようです。


■ 事例2: 中堅ECショップ

上の事例1が想像以上の一極集中ぶりだったので、さらにもう1つ、

データが公開されているECショップを探して集計してみました。

○ 中堅ECショップ

ソフトウェア電子書籍等のコンテンツ販売

・商品点数:約2800点

・調査日:2014/03/12

事例1のショップに比べると小規模ですが、一時期はツイッター等でも話題になったショップです。

以下、集計したグラフのみを示します。


○ 商品ごとの販売数状況

f:id:rikunora:20140416153730p:image


○ 商品ごとの売上状況

f:id:rikunora:20140416153804p:image


■ 事例3: Amazon

最も気になるECショップの雄は、やはりAmazonでしょう。

Amazonは売上データを公開してはいませんが、間接的に推測する方法も無くはありません。

その方法によると、Amazonはどうやら「ビッグヒット支配型」だということです。

* Amazonに見る小さなビッグデータ >> id:rikunora:20130806


■ 事例4: Topはてな

次はブログの事例。

はてなブログを利用している人であれば、"TopHatenar"というランキングサイトをご存じかと思います。

* TopHatenar >> http://tophatenar.com/

このランキングを見ると、ブログにおいても上位が突出している様子が実感できます。

f:id:rikunora:20140416153857p:image

TopHatenarのグラフは対数表示になっていますが(1, 10, 100, 1000…という桁で目盛りが刻まれている)、

これを普通の目盛りに直すとどうなるでしょうか。

f:id:rikunora:20140416153926p:image

これは、TopHatenarにあったブクマ数を普通の目盛りに直したヒストグラムです。

区分の幅は1000ブクマごと。全体の 98.6%が、1000件に満たない最初の区分に含まれています。

順位とブクマ数を両対数プロットすると、このようになりました。

f:id:rikunora:20140416154005p:image

上のECショップ事例1に比べると、下位の落ち込みは小さくなっていますが、

それでもベキ乗則(直線)よりは、むしろ緩いカーブを描いています。


■ 事例5: ニコニコ動画

動画再生数の傾向は、上のECショップ事例1にそっくりです。

以下の記事をご覧あれ。

* ニコニコ動画再生数は対数正規分布に従う >> id:rikunora:20140320


■ 事例6: Androidマーケット

* AndroLib -- Androidマーケットにおけるダウンロード数の分布

>> http://www.androlib.com/appstatsdownloads.aspx

f:id:rikunora:20140416154041p:image

全体の 60.9% がダウンロード数 50未満。

全体の 5.3% がダウンロード数 5万超え。


■ 事例7: 人気投票

2009年当時の過去記事ですが、ラノベの人気投票もベキ分布に近い。

* 人気投票はベキ分布 >> id:rikunora:20090820


■ なぜ一極集中するのか?

なぜ、インターネットのアクセス状況は一極集中するのか?

様々な理由が考えられるでしょうが、最も有力なのは、

 「それまでに持っていたリンク数に比例して、新たなリンクを獲得する」

からだと思います。

早い話、人気が人気を呼ぶ、というわけです。

* べき分布メカニズム >> id:rikunora:20091130


こうした一極集中を語る上で、よく引き合いに出される「ベキ乗則」ですが、

個々の事例を調べると、必ずしもベキ乗則に完全一致しているとは言い難いようです。

上の事例の中にも、

 ・両対数プロットを見ると、直線と言うよりむしろ上に凸のカーブに近い.

 ・ベキ分布と言うより、対数正規分布に近い.

といった様子が見られます。

ベキ乗則は第1近似としては正しくても、より詳しく見た場合、必ずしも全てを説明するわけでは無いようです。


■ 上位を全体と思い込まない

例えばECサイトでは、上位のヒット商品は極端に目につきやすく、

中位以降はなかなか目に触れるチャンスが無い、といった事情があります。

口コミにしても、ランキングにしても、大勢を占めるのは結局のところ上位です。

そうした上位フィルターを介して情報を受け取った場合、

「上位=世界の全て」であるという勘違いが生じる危険が付きまといます。

幾つかの成功事例を耳にして、そんなものかと思って自分でもやってみたところ、聞いた話とは全然違っていた・・・

果たしてその成功事例は、全体でどの程度の位置を占めるているのか。

セールストークは向こうからやってきますが、確かめる側の情報は自分から取りに行く必要があります。


■ 近況

※ ここ最近、データやら統計やらの調べ事がやたらと多くなってきました。

※ そのため、なかなかブログ更新もできない状況です。

※ 一部の方には、返事、連絡、コメントが返せなくてすいません。

※ 決して無視しているわけではありません。


スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/rikunora/20140416/p1