Hatena::ブログ(Diary)

Life like a clown このページをアンテナに追加 RSSフィード

2011-02-11

Twitter 関連サービスの SBM ランキング

ふと Twitter 関連の Web サービスの SBM ランキングを作成してみようと思い立ちました.ググって見ると,つい最近 本日決定!Twitter関連サービス全201サイトはてブ順ランキング - パパパパ と言う記事が人気を集めていたようなので,このリストを使用して はてなブックマーク 以外のブックマーク数も合算した値でランキングを作成し,ランキングがどのように変わるかを観察してみました(Topsy など海外の有名なサイトをいくつか追加しています).作成したランキングは以下のページ.

ざっと見た感じでは,Delicious のブックマーク数の影響でで上位の顔ぶれがだいぶ変わっています.基本的には,はてブと Delicious の影響力が大きくついで Yahoo! ブックマーク,だいぶ離されて livedoor クリップBuzzurl と言う感じになっています.

目についた所では,ツイナビ・Twitterガイド の Yahoo! ブックマーク数が(Yahoo! ブックマークの中では)何故か突出していて,SBM サービス毎の性質の違いが垣間見たような気がしました.

各種 SBM からブックマーク数を取得する部分は,いろんなソーシャルブックマークサービスのブックマーク件数を数値で取得するRubyのクラス書いた - What is Normal 〜 もはや普通がわからない 〜 を参考にして記述したものを github に公開しています.

これを使用した Twitter 関連の Web サービスの SBM ランキングを作成するためのクラスが以下になります.

module Twitter
    class SBMCounter
        require 'net/http'
        require 'uri'
        require 'kconv'
        require 'crown/hatena/bookmark'
        require 'crown/livedoor/clip'
        require 'crown/delicious'
        require 'crown/buzzurl'
        require 'crown/yahoo/bookmark'
        
        Entry = Struct.new(:uri, :score, :hatena, :livedoor, :delicious, :buzzurl, :yahoo)
        
        def initialize()
            @entries = Array.new
        end
        
        def add(uri)
            entry = Entry.new
            entry.uri = uri
            
            # 各種 SBM サービスからブックマーク数を取得する
            entry.hatena    = Crown::Hatena::Bookmark.count(uri)
            entry.livedoor  = Crown::Livedoor::Clip.count(uri)
            entry.delicious = Crown::Delicious.count(uri)
            entry.buzzurl   = Crown::Buzzurl.count(uri)
            entry.yahoo     = Crown::Yahoo::Bookmark.count(uri)
            
            entry.score = entry.hatena + entry.livedoor + entry.delicious + entry.buzzurl + entry.yahoo
            @entries.push(entry)
            
            return self
        end
        
        def each()
            @entries.sort { |x, y| y.score <=> x.score }.each { |entry|
                yield(entry)
            }
            return self
        end
    end
end

メイン部分は以下のような感じ.

counter = Twitter::SBMCounter.new

File.open(ARGV[0]) { |file|
    file.each { |line|
        begin
            line.chomp!
            counter.add(line)
        rescue Exception
            $stderr.puts(line)
            next
        end
    }
}

counter.each { |entry|
    printf("%5d %4d %4d %4d %4d %4d %s\n", 
        entry.score,
        entry.delicious,
        entry.hatena,
        entry.livedoor,
        entry.buzzurl,
        entry.yahoo,
        entry.uri
    )
}
Related Pages

2011-01-16

フィルタリング・カテゴライズ用リンク集

はてなブックマーク 年間ランキング TOP100 の推移 の最後に触れた「はてブ衆愚化」の話に関して.

「はてブは終わった終わった」みたいなのは2年以上まえから言われてるんだろうけど、最近は本格的に面白い情報が見つからなくなった気がする。アフィリエイトというインセンティブのある2chまとめ系の躍進によって、情報過多に陥ってはてブの地位が相対的に下がったという考え方もできるけど。ただ2chまとめ系のブログの情報は流し読み以上の価値を感じなくて、ただの懐古かもしれないけど、興味深い記事が多かった昔のはてブのようなサイトを見たいという欲求がある。

いまさらはてブ衆愚化の話。

ホットエントリに挙がってくる記事に関して現状発生している問題の一つとして,特定のジャンル・スタイル(所謂,定番サイト)のものが非常に多くピックアップされてしまうと言うものがあります.代表的なものとしては,痛いニュース(ノ∀`) のような 2ch まとめブログ系の記事や GIGAZINE のようなスタイルを取っているニュースサイトが挙げられます.これらをフィルタリング,または独立したカテゴリに分類する事で,恐らく何もフィルタリングしない状態に比べてピックアップされる記事の顔ぶれが随分違って見えてくると予想されます.

そんな訳で,フィルタリング・カテゴライズ用にリンク集を作成してみました.

列挙した Web サイトは TopHatenar のブックマーク数上位 300件の中から探して分類してみました.今回は,何らかの一次ソース(2ch のスレッド,海外の記事,アプリ,etc)を紹介すると言うスタイルを取っている Web サイトのみを集めました.自らが一次ソースとして何らかの主張・情報を発信しているような Web サイトは今回は(多分)外してあります.

せっかくなので,上記に列挙した Web サイトをフィルタリングするとどの位の影響が出てくるのかをはてなブックマーク数から推測してみます.2011/01/16 現在のブックマーク総数が 80,513,786 ブックマークだそうなので,カテゴリー毎に列挙した Web サイトのブックマーク総数から占有率を計算してみます.

カテゴリー サイト数 ブクマ総数 占有率
合計 83 7,723,090 9.59%
2ch まとめブログ 41 3,119,784 3.87%
Web デザイン・開発 8 1,122,206 1.39%
ソフトウェア・サービス 6 428,796 0.53%
ゲーム・アニメ・漫画 5 184,708 0.23%
エロ画像 4 54,231 0.07%
その他ニュースサイト 19 2,813,365 3.49%

83 サイトで,はてなブックマーク全体の約1割 (9.59%) を握っている事になるようです.これに加えて,大手新聞各社をフィルタリングなり別カテゴリーに振り分けるなどするとだいぶ違った結果が見えてくるのではないかと思います.

今回は何らかの一次ソースを紹介する Web サイトに絞って纏めましたが,それ以外では「ライフハック系ブログ」,「SEO 関連ブログ」も TopHatenar 上位にそれなりの数のサイトがランクインしており,この辺りも独立したカテゴリーを設けるのが良さそうです.

今回は,どのように分類できるかを調べただけでしたが,そのうちフィルタリング・カテゴライズするための何かを作れればなと思います.

2011-01-15

はてなブックマーク 年間ランキング TOP100 の推移

Delicious が閉鎖するとかしないとかで話題になった ときに,個人的には 集合知の実現方法 として期待された SBM (Social BookMark) も終焉を迎えるのかなぁとか考えていましたが,上記のニュースを受けて,国内の SBM サービス一番手であるはてなブックマークも「大丈夫なのか?」と存続を心配する声もぽつぽつ聞こえました.

そんな時に,ちょうど 歴代はてブ多い順 / 月ごとのランキング 2013年5月 1位?50位 と言う Web サイトを発見したので,今回はこの Web サイトに列挙されてある各年のはてなブックマーク 年間ランキング TOP100 のブックマーク数をグラフ化して,はてブが Web サービスとしてどの位成長し続けているのか見てみる事にします.尚,各年の上位 10件位は何年もの間ずっとブクマし続けられている記事があるので TOP10 位までは除外して見るほうが良さそうです.

年間ランキング TOP100 のブックマーク数の推移

f:id:tt_clown:20110115185631p:image

このグラフを見てまず目を引くのが 2007年でした.下図は,各年の TOP100 のブクマ数の総計をグラフ化してみたものですが,TOP100 のブックマーク総数で 2006年どころか 2005年にも負けています(2005年は,上位に「6年間ブクマし続けられている記事」が多いせいでブックマーク総数が押し上げられていると言う事もありますが).これを見ても 2007年の苦戦がよく分かります.

f:id:tt_clown:20110115185632p:image

2007年に苦戦した後 2008, 2009年は順調に増加を続けていますが,2010年はその勢いにやや陰りが見えます.

ブクマ総数の推移

タイトルからは外れますが,今度は Internet Archiveウェブ魚拓 に残っている http://b.hatena.ne.jp/ のキャッシュから「ブックマークされた記事総数」と「ブックマーク総数」を抽出してみます.下の表は,ブックマーク総数が抜き出せる範囲内で大体 1年おきの結果を並べたものです.

日時 記事総数 記事増加数 ブクマ総数 ブクマ増加数
2011/02/04 28,792,231 Δ9,477,589 82,075,482 Δ25,392,788
2010/02/14 19,314,642 Δ7,292,501 56,682,694 Δ21,156,914
2009/02/08 12,022,141 Δ4,648,374 35,525,780 Δ14,476,100
2008/02/05 7,373,767 Δ3,508,874 21,049,680 Δ10,659,700
2007/02/02 3,864,893 Δ2,537,365 10,389,980 Δ7,537,746
2006/02/02 1,327,528 Δ908,538 2,852,234 Δ2,138,389
2005/07/06 419,060 - 713,845 -

表だと分かりにくいので,図にしてみます.下図は,年毎におけるブックマーク数の増加数およびブックマークされた記事数の増加数を表したものです.尚,x軸は (x-1)年〜x年 の増加数を示しており,例えば,2006の点は 2005年〜2006年の各種増加数を表しています.

f:id:tt_clown:20110213224056p:image

表の方を見ると,ぱっと見 2009〜2010年の伸びが凄い感じでしょうか.このせいもあって2010〜2011年の伸びの鈍化が際立っています(追記: 2011/02/04 に改めてデータを取得して比較してみると,そうでもありませんでした).ただ,図にしてみるとそこまで鈍化している訳でもないような印象も受けます.尚,こちらの結果では 2007年には特に目立った変化はないので,ブックマークのされ方に変化が出た(いろいろな記事のブクマ数が平均して伸びるようになってきた,とか)年だったのかもしれません.

尚,本筋からは外れますが,TopHatenar を見ると 1位の GIGAZINE のブクマ総数が 871,646 と言う事で全ブックマーク数の 1% を握っている事になり,凄い影響力だなぁと感じます.調査していないので正確な事は言えないですが,「8:2 の法則*1」どころの話ではないのだろうと思います.

その他雑感

最近ははてブネタなどで盛り上がっている場面を目にする機会も減り,どういう状況なのだろうなぁと思ったりもしましたが,まぁ何だかんだで利用数としては順調に増えているのだろうと予想されます.はてブネタと言えば,いまさらはてブ衆愚化の話。 が久々に賑わっていたので,これに関連した話で自分の感想をちょっとだけ書くと,例えば はてブニュース を眺めていて一番変わったと感じるのはネタでも何でもない普通のエロ記事(エロ画像がただ羅列されている記事)が頻繁に挙がってくるようになった事で,この辺りから SBM も大衆化が進んでいるんだろうなと予想しています(エロにどれ位侵食されているかが大衆化してきたかどうかの基準の一つかなと勝手に思っています).

はてブネタが挙がらなくなってきたと言うのはそれだけ枯れてきた(普通の Web サービスの一つとして認識され利用されるようになってきた)とも捉える事ができ,所謂キャズムを超え始めていると言う事なのかもしれません.

あ,はてなと言えば,MacBook Air 11インチ欲しい! と書いておくと MacBook Air が当たるかもしれないらしいのでついでに書いておきます.ブログ生活は・・・まぁ週 2〜3 更新を守れたらなぁと思ってます.

Downloads
Related Pages

*1:2割の Web サイトがブクマ全体の 8割を握っている

2010-09-17

ブックマークファーム

昨日,はてブニュース を見ていたら,ブックマークページに「アメブクま」と言うタグの並んでいる記事を見つけました.気になってググってみると,どうやら Ameba ぐるっぽ と言うサービス内にあるコミュニティの一つのようです.

はてなブックマーク等のブクまIDを取って大幅アクセスアップ!!貴方が読者さんやアメンバーさん達のブログをブックマークすればその人達のブログもアクセスアップ!

当然読者さんやアメンバーの人達がアカウントを取れば貴方のブログや記事がぶくまされる機会も多くなります。

【アメブロアクセスアップ】ソーシャルブックマークグルっぽ「アメブクま!」|Amebaグルっぽ

思想的には リンクファーム に近いでしょうか.

これまで,はてなブックマークでは これはspamですか? - 好奇心と怠惰の間 などのように「特定グループが徒党を組んで*1グループ内の記事を相互にブックマークし合う」と言う現象がいくつか観測され,そのたびに問題提起がなされてきました.ただ,これまでは「対象となるグループの構成人数が少ない」,「一時的なものである」などの理由で,放っておいてもそのうち消えると言うものばかりでした.

これらに比べると,今回の例は構成人数(2010/09/17 現在,160人)などの点でもう少し大きな問題になる可能性があります(昨日閲覧した時には 140 人台だったので,かなりのスピードで増加しているようです).

BOT を使うなどメンバ全員の記事を機械的に相互ブックマークしていくのであれば,はてな側も SPAM として弾くでしょうが,上記のようにブックマークする際に各メンバの判断が入るような事例だと対処方法に困りそうです.また,コミュニティ内でも発生し得る問題については認識しているようで,以下のようなコメントが残されていました.

「アメブクま!」について思うこと
http://ameblo.jp/miton-at-rulal/entry-10631960126.html

相互ブックマークの「不自然さ」にちょっと疑問を持たれたということ。行き過ぎるとスパム的になってしまうのではないかと、危惧されています。

・・・(中略)・・・

まず、意見を言わせていただきます。

mitonさんの、
自分が「これはいい記事だ」って思う記事に対してブクマする。
というやり方に賛成です。

ただし、気に入った あるいは 友達のブログをブックマークするのはごく自然なことです。そういう自然なブックマークを咎めるような空気にはなって欲しくないな。と思います

ソーシャルブックマークについてのそれぞれの考え ご意見、質問など|Amebaグルっぽ

よく「SBM の正しい(本来の,本当の,...)の使い方とは」のような話を見たり,聞かれたりします.この際に,「ブックマーク」と言う言葉に拘って「後から再び閲覧する(可能性の高い)記事のみを追加する」行為を「本来の SBM の使い方」と主張する人にもしばしば出会います.

この主張は,これはこれで一理あるとは思います.ただ,実際の SBM の使われ方(特に,はてなブックマーク,およびそれ以降に出現した国内の SBM サービス)としては,それよりはもう少し緩い形で「何となく気になったときにぽちっと押す」位のものが主流であるようにも感じます.これは,どちらかと言うと twitter の fav ボタンや各種 SNS の like(イイね!など)ボタンに近い役割となります.この観点で考えると,上記の主張にある(友達は置いておいて)「気に入ったブログ(記事)をブックマークする事」は,現状ではまぁ自然と言っても良いレベルかなとは思います.

また、リンクファームでも実際に問題になるのは数百・数千規模単位で行われる大組織のネットワークです(=小規模なら検索エンジンに見つからない、ということにもなりますが、やるかやらないかは各自のご判断でどうぞ。仮に検索エンジンのインデックスから除去されても皆さんの自己責任でお願いします)。

リンクファームと相互リンクの違い :: SEO - FAQ

リンクファーム問題でもそうですが,この辺りの問題は,結局(対象となるグループの)規模次第になる事が多いです.そして,規模と言う点では,現状のはてなブックマークの新着エントリ掲載への閾値 (5users) を考えると上記の 160人と言うメンバ数は十分脅威(問題)になり得る規模です.アメブクま! は,今後どう言った問題が起こるか,また,それらの問題にはてな運営側がどういう判断を下すのかに興味があるので,しばらく注目していようと思います.

尚,個人的には, はてブユーザ間の類似度 - Life like a clown で述べたように「ユーザ間のブックマーク内容の類似度を取って,その値に応じて生の被ブクマ数を低減させた値を新着エントリなどのページに掲載する際の閾値に用いる」と言う形が良いのではと思っています.この方法に関しては少し真面目に考えた事もあったので,この方法で低減させた結果を見てみたい気もしました.

Related Pages

*1:徒党を組んでいると言う認識の有無は別問題として,結果としてそう言う形になってしまったもの

2010-07-02

はてブコメントの一覧性と「これはひどい」状態になる条件

はてブコメント論 2010 梅雨.

Twitter / akcanon: @shisetu 飲めない事をただ強調するんじゃなくてキチン ... と言う呟きに対して,はてなブックマーク上で同じような論調のコメントが大量に書き込まれたため,その状況を好ましくないと感じた人達とで(主にメタブで?)はてブコメント論が再燃したようです.

一覧できる事によって増幅される不快感

b:id:sekiryo あのブクマ善意の一般市民のデモとやらに紛れて個人特定されない場所から腐った玉子投げる人みたいな卑劣な感じがしてヤだよなぁ。口汚い人間は文字だけ見ててそこに人間が居ると思ってないから無視してもいいと思う

b:id:maki_tetsu いつの間にかこの人が飲みを強要する人代表にすり替わってる。「こういう奴は説明したって分かりっこないんだよ」とか、いつの間にか見えない敵に向かって吠えはじめてるはてなーがひたすらキモかった。

はてなブックマーク - Togetter - まとめ「飲めない人は飲めない理由をきちんと説明すべき。学生じゃなくて社会人なんだから」

個人的に興味深いと感じたのは,上記ようなのコメントを残したユーザ達は自分も「卑劣な感じがする」とか「キモい」と批判している人達と同類の存在になる(他のユーザにそう認識される)可能性が十分にあったと言う事をどの程度認識していたのだろう,と言う事でした.

はてなブックマークに対する問題提起の一つに「コメントが一覧できてしまう事によって,(場合によっては)不快感が増大してしまう」と言うものがあります*1.上記のコメントも,個々としては,そこまでひどいと感じるようなものではありません.しかし,同程度の口調で同じような批判が 100個も 200個も並ぶと,それらを閲覧した人の印象もずいぶんと変わってきます.

「観衆」としてのコメント

はてブコメントについては,歓声としてのはてなブックマーク と言う意見が存在します.はてなブックマークでコメントを書くユーザの心理はテレビ,ラジオ,スタジアム,...で何かを視聴している観衆が,何か(応援,批判,野次,愚痴,...)を呟くときの心理に近い,と言う意見です.私もこの意見に賛同しています.はてなブックマーク - Twitter / Akihiro Kano: @shisetu 飲めない事をただ強調するんじゃなく ... については「一々この程度のことで200もブクマで批判していたらキリがない」と言う意見もありましたが,上記で批判(のような)コメントを残している人達の多くは,批判していると言う認識は薄く,どちらかと言うとテレビでひどい映像を見たときに愚痴を言うような感覚に近いのではないかと感じています.

以前に同じような意見を述べた際に,下記のような反論をもらいました.

b:id:blackdragon はてブでコメントしている人の多くは、自分のidと紐付けられてそのコメントが評価されることを自覚していると思うが。

はてなブックマーク - 何故はてなブックマークには「アフォ」なコメントが多いのか? - Life like a clown

はてなブックマークでコメントを書いているユーザの多くは,「自分が書いたコメントが不特定多数に閲覧される」と言う事実はきちんと認識していると思います.したがって,多くのユーザは見られると困るようなもの(犯罪自慢,個人情報,...)は書き込まないし,先に引用したユーザにしても,自分のコメントが不特定多数に閲覧されても別に構わないと思っているだろうと予想されます.

しかし,私は,はてブでコメントしている人の多くは「コメントが評価されること」ははっきりとは自覚していないのではと感じています.コメントしている人の多くは,恐らくは「自分が書いたコメントが他にどのような影響を与えるか」という事はあまり意識していません.これは,何らかの観戦をしている観衆が「自分が野次を飛ばす事によって周りにどのような影響を与えるのか」と言う事については,あまり深く考えていない所と似ています.その意味でも,私はコメントを書く人と観衆(正確には「応援をしたり,野次を飛ばす」観衆)と言うのは非常に近い性質を持っているように思います.

ただし,私は,その状況を悪いとは感じていません.自分のコメントが他にどのような影響を与えるかを予想する事は非常に難しい事です.そういった難しい事を要求してしまうと,コメントを書く事への心理的抵抗感を上げてしまいコメントが激減する事が予想されます(関連: はてブコメント論 - Life like a clown).

Web(特にここ 5年くらい)では,「書き手には何でもいいからとにかく投稿してもらって量を稼ぎ,質に関しては Google などの検索エンジン,はてなブックマークなどの SBM,ニュースサイトなどの機械的,人力的な編集機能で(ある程度)保障していく」と言う原則で動いてきました.その意味でも,個人的には,この辺りの問題に対しては「より有効なフィルタリング,カスタマイズ機能」に期待したいと思っています.

コメント欄が「これはひどい」状態になる条件

しばしば批判の対象となるはてなブックマークのコメント欄ですが,個人的には,今回のようにコメントが同じような論調のコメント一色で埋まる例は割と稀なケースであるように思います.そこで,最後にコメント欄が「これはひどい」状態になる条件について少し考えてみたところ,以下の 2点が満たされた場合かなと思いました.

  1. 論点が一つ(または非常に少数)である事(≒突っ込みどころが一つであること)
  2. 誰もが言及しやすい話題である事(参考:自転車置場の議論 - bkブログ

こう考えると,twitter の呟きと言うのは今回のような事例が起きやすいのかなと感じました(文字数を140字に制限されているので,あまり多くの事に言及できない).したがって,今回のような例は,twitter が普及するにつれて徐々に増えていくのかもしれません.

References

*1:この問題に関しては,はてな側も はてなブックマークのコメント一覧非表示機能について - はてなブックマーク日記 - 機能変更、お知らせなどと言う案を提供するほど根強いものとなっています.