ggtter開発しました

ggtter(ぐぐったー)というWebサービスを開発しました。
http://ggtter.com/

一言でいうと知人などと検索ワードを共有するサービスです。
普段検索を行っているように検索窓から検索するとgoogle検索を行い、検索ワードを公開・共有します。
このサービスを使うと、一般のGoogle検索と比べて、以下のようなメリットがあります。

  • 自分の検索ワードを保存することができます。
  • 普段見ることができない他人の検索方法などを見る事ができます。
  • 知人・友人に自分の興味をゆる〜くオススメすることができます。
  • 検索した直後に、同様の検索ワードで検索したユーザを知る事ができます。


各ユーザの画面に流れる検索ワードは、Twitterのように自分がフォローしているユーザの検索ワードだけですので、興味の近いユーザについてだけの検索ワードを見ることができます。


firefoxかIE8を利用している場合は、ワンクリックで簡単に検索プラグインを追加でき、右上の検索バーから検索できるようになります。


新しくアカウントを作るのが面倒な方は、TwitterIDでのログインも可能です。
TwitterIDでログインした場合、Twitterのフォロー関係を取得して、Twitterでフォローしている中で、ggtterを利用した事のあるユーザの検索ワードを見ることができます。
現在ログインは、OAuthには対応していませんが、希望が多ければ近いうちに対応しようかと思っております。

ネットの未来カンファレンスへの参加

ネットの未来カンファレンスに参加してきましたー!!
全体的に和やかな雰囲気で、笑いの多いカンファレンスでした。
議論の内容は、ほとんどアドリブだったため玉石混合といった感じでした。
アドリブなのに面白い話もいくつか出てパネリストの方々はさすがだなと思いました。


私は途中からの参加でしたが、とりあえず記録を取っていたものを書いていきます。
ログ的なもので分かりにくい所もありますが、ご勘弁下さい。


【テーマパネル2・情報洪水時代の情報探索、キーワードの先へ】
パネリスト
石垣 陽さん(セコムIS研究所)
大向 一輝さん(国立情報学研究所
澤村 正樹さん(NTTレゾナント
中谷 桃子さん(NTTサイバーソリューション研究所)
司会・進行 徳力 基彦さん(アジャイルメディアネットワーク)


■検索のインタフェースについて以下のような議論がありました。
・検索はカーナビのようなもの
・一般人にとって検索は難しい。最初に何を入力したらいいか分からない。
・検索窓
→窓と言っているのに先に何があるか見えないインタフェースが問題。
・人→検索エンジン→ウェブという流れになっている。
検索エンジンとウェブをつなぐのは何十万人っていう人間がやっている。しかし、人と検索エンジンの間をつなぐものをやっている人は少いので、こちらが重要。
・機械対人になると道具として人は扱う。道具側からのアプローチがない。機械側から機械が人だと言うようなことがいい。


■検索の現状について以下のような議論がありました。
・何も知らない子供は、お母さんがどこにいるか調べたいと思ったみたい。
・最初に出てくる情報が所望の情報じゃないとインターネットって使えないようねってなっちゃう。
・機械側がトリガーになって人間に何か教える。要するにレコメンデーションみたいなもの?
・RSSリーダーが大向一輝今何やってるんだツールになる
自然文検索はずーっとあるけど、それほど満足した結果が得られていない。人間が入れるようにしたほうがいいんじゃないか?
・「今他の人が調べているので、その結果を教えるよ」byPC みたいなのがいい。


■現状こんなサービスがあります。
5W1Hサーチという検索サービスがある
→何十億あるページからキーワード一つでぴたりとあてるのは無理じゃないかという理由で作成。
・Photomemo
flickrtwitterをあわせたようなもの。ケータイに特化。
・つながる灯り。スイッチと証明で遠隔のコミュニケーション。遠隔にいる恋人、子供がいつ帰ってきたかとか分かる。


■こんなのがあるといい
言語化できない感情情報を感じ取って情報を提示してくれるもの
ジェスチャー、視線などで調べたいことを調べられる
・誰に聞くかを選びたい
・人生相談。
ライフログからできるようになるかもしれない。
・聞いている音楽と情報レコメンドの連携
・検索結果をA4一枚でまとめて表示してくれる
・情報に命が吹き込まれた
・ネットから生きる喜びを得られたら良い

【メインセッション「ネットの未来放談・大喜利」】
猪子 寿之さん(チームラボ)
岩佐 琢磨さん(Cerevo
楠 正憲さん(マイクロソフト
森 正弥さん(勉強会コミュニティGnZ)
司会・進行 藤代 裕之さん


■ネットの未来について
・ネット以外のものネットになっていくべき。組織構造、空間がネットになっていくべき。
・企画が偉くて、技術者が下みたいな組織が多い。チームラボはもっとフラット。クリエーターとエンジニアがフラット。
・人間はてんぱってくると検索窓に語りかける。そうすると、似たような悩みを抱えてる人の文章が得られて癒される。
・Gnzは働き方の未来について語る。
・昔だったらできなかった研究が今はできるようになってきている。例:100台PCを使ったクラウドの研究。
・世界中の人と会わずにビジネスが成立する
・コミュニケーション能力が低いほうがいい
→コミュニケーション能力が高いと女子大生とかと話して楽しむけど、低いと自分の興味の深い分野に対して詳しくブログを書く


■ネットの未来大喜利
お題:2020年ビルゲイツは孫になんと言ったか?
ネットは広大だわ
・ネットは一日一時間
・体で感じろ
→先進国の優位性がなくなってきて、そのうち全くなくなる。先進国のみの優位性は文化のみ。
→インドはソフトウェアの開発はすごいけど、UIを頼むことはできない
→現在のPC利用者は10億人。


■ネットの未来結論
・画面の外が大事。画面の外×インターネット。
・ウェブは現状足し算、拡大。そうじゃなくて、引き算が重要。
・個人レベルでは見切り発車が大事。


最後に私の個人的感想です。
大向さんの「人→検索エンジン→ウェブという流れになっている。検索エンジンとウェブをつなぐのは何十万人っていう人間がやっている。しかし、人と検索エンジンの間をつなぐものをやっている人は少いので、こちらが重要。」という話が面白かったです。
確かにその通りで、特に検索に慣れていない人にとっては、人と検索エンジンの間をつなぐ何かが必要なのではないか。
バンと検索窓だけがあっても、一般人はあまり使わないと思うし(どういう使い方したら面白いか分からない)、かといって、一般的なポータルサイトのようにゴテゴテのトップページは、インターネットってなんかごちゃごちゃしてて分かりにくいよねってなっちゃうと思います。
検索リテラシーの高い方々にとっては必要ないかもしれませんが、一般の方々のためには検索サービスをデザインする必要があります。ユーザを導くような検索デザインが面白いと思いました。
そういった意味で、5W1H検索は、現時点で有用かどうかは別として、アプローチとしては面白いと思いました。
人と検索エンジンの間をつなぐもの、これは一つの研究のヒントになったような気がしました。

第2回SBM研究会に参加&発表してきた感想

第2回SBM研究会に参加してきましたー!!
しかも、今回はずうずうしく発表までしてしまいました。


私の発表内容は、ソーシャルブックマークの時間データを利用した情報フィルタリングと検索に関してです。
ソーシャルブックマークの時間情報についての分析結果と、開発したサービス「セレクトブクマ」についてがっつり発表しました。
皆さんから色々と貴重な意見を頂けて、発表できてほんとによかったと思いました。


ちなみに、発表資料は以下にあります。
http://homepage3.nifty.com/toremoro/study/SBM2/sbm_ueno.pdf


また、セレクトブクマのURLは以下です。
http://plazman.chi.mag.keio.ac.jp/sbm/summary.jsp

12/7(日)は8:00〜サーバ停止のため利用できません。月曜日には復旧します。
利用してくれた方は、アンケートフォームに回答して意見を書いてくれるか、はてブしてコメントに意見を載せてくれると非常にありがたいです。


他の人の発表についても印象に残ったものの感想を書いていきます。
まず、最初の大向さんの発表ですが、4dkというサービスが非常に面白かったです。
ソーシャルブックマークのコミュニティ化には以前から興味があったので、話を聞けてよかったです。


あとは、やはりはてな伊藤直也さんの発表が非常に面白かったです。
はてブのデータを色々聞けたので以下にまとめておきます。

・アクセス:300万/月(ユニークユーザ)
・ユーザ数:20万アカウント
・エントリー数:1000万エントリー
・ユーザー数の伸び率が少しずつ増えてきている
・国内ははてブがダントツ、国外はデリシャスがダントツ

また、はてブはIT系・技術系のページに偏っていると思われがち(はずかしながら、私もそう思っていた)なのですが、実は全体的に満遍ないカテゴリの記事があるということでした。
これははてブデータを利用した検索サービスを作っている自分としては明るい情報だと思いました。

また、はてブがワイドショー化していることを問題視していましたが、これはどちらかというと良いことだと思いました。
はてブは技術者だけではなく、どんどん一般人のユーザも増やし、トップページはワイドショー化されたページを表示するべきだと思いました。
その上で皆が満足できるよう、コミュニティをユーザ側から立ち上げることができるようにし、かつ、複数のコミュニティに参加できるようにすべきです。
さらに、それらを総合して人気のエントリーを取ってくる、自分だけのトップページも表示できるようにするべきだと思いました。
そうすることによって、一般人もギークも趣味・趣向が偏った人も皆が満足できるサービスになり得ると考えています。

研究者側の立場から見ても、ソーシャルブックマークのユーザが増えることは明るい情報ですし、コミュニティに注目した新しい視点での研究ができる可能性があるという面白味も感じます。

セレクトブクマ公開

自分が作成したWebサービス「セレクトブクマβ版」を公開しました。
http://plazman.chi.mag.keio.ac.jp/sbm/summary.jsp


以下にセレクトブクマの説明を書いていきます。


セレクトブクマは、指定したタグに対して、長い間ブックマークされ続け、かつ、指定されたタグでの被ブックマーク数が多いWebページを検索するサービスです。
はてなブックマークのデータを利用させてもらっています。


ソーシャルブックマークのデータを分析したところ、大まかに分けて次の2種類のタイプのWebページがあることが分かりました。


(1) 急激にブックマーク数が伸びて、その後はほとんどブックマークされなくなるタイプのページ
(2) 長い期間に渡ってブックマークされ続けるページ


また、上記の2種類のタイプのページを分析しました。
その結果、(1)のタイプのページは、ニュース性・話題性・議論性の強いブログなどに多く、
(2)のタイプのページは、有用なWebサービスであったり、よくまとまった技術解説サイトであったり、
何かのまとめサイトなどが多いことが分かりました。


そこで、私は以上のソーシャルブックマークの特性を利用して、タイプ別にWebページを分類するシステムの開発を行っています。


まだ、開発途中の部分もありますが、現状で開発したものは、タグを指定することによって、指定したタグにおいて、長い期間に渡ってブックマークされ続けるタイプのページをあるロジックに基づき、取得するWebサービスです。
実際に動かして見ると、たとえば「Java」というタグを選択して上位10件取得した場合、Googleで「Java」と検索して出てくる上位10件よりも、Javaプログラマーにとっては有益なページが取得できています。
同様に技術的で、ある程度以上有名な1単語検索に関しては、Google検索に勝っているものが多いと考えています。(現時点では、まだ私個人の主観ですが)


また、研究室内で行ったアンケートででは、本システムを利用することにより、5人中5人が何らかの有益なWebページを発見できています。


今後の予定としては、ソーシャルブックマークの時間情報とブクマされるページのタイプをさらに分析し、分類ロジックの改良をしていこうかと考えています。
さらに、他にも作成中のシステムがあります。完成しましたら、また、こちらのブログやtwitter(@wilfue)などで公開していこうと思っています。

SBM研究会の感想+私のSBMデータを利用したシステムについて

SBM研究会行って来ましたー!!


私はSBMのデータを利用して、Webページの推薦やコンテンツ分類の研究を行っているので、正直今日のSBM研究会は非常に期待していたイベントでした。
しかしながら、内容はそれ以上に有意義なものでした。第二回もぜひぜひ参加したいと思いました!!


最初の横田さんのプレゼンでは、SBMの現状とこれからについて貴重な意見が聞けました。
現在のSBMユーザがインターネットユーザ全体の7%らしいです。これは、思っていたより多かったのでこれはうれしい誤算
でした。しかし、今後のSBMの方向性として、SBMユーザは増えず、現状の7%程度のパイを各SBMサービスが取り合う形になるという考えを聞き少し残念に思いました。
確かに私も、del.icio.usはてブをはじめとした各種SBMサービスが、現状の形のままではSBMユーザの増加は見込めないと考えています。しかし、今後UI面の劇的な改良やブクマを公開することへの抵抗感をなくしていくような方向へのシフトが見込めれば、SBMユーザの増加が見込めるのではないかとも考えています。理想論を述べると、IEなどのブラウザにデフォルトとして、SBM機能が埋め込まれると良いと思います。そして、ユーザがブクマを公開するかどうか以下の3つの選択肢の中から選べると良いと思います。

・ブクマ情報を完全に公開
・ブクマ情報をマイクロソフトのみに公開し、推薦や似ている人発見などのサービスは利用可能
・ブクマを完全非公開

現状、大半のインターネットユーザはIEを利用しており、そのIEにデフォルトで搭載されている機能なら、皆がSBMの存在を知ることになるし、デフォルトである機能なら使ってみようという人も大幅に増加するのではないかなどと考えたりしています。
まあ、そんな夢物語をここで語っても、マイクロソフトがそんなことをやるとは到底思えないですけどね。。。


2番目の東工大の宮田さんと佐々木さんによるSBMデータを用いたwebコンテンツ推薦の話は、私もwebコンテンツの推薦をやっているので、非常に勉強になりました。特に、SBM研究のトレンドの話や有名な論文紹介の話が面白かったです。また、この研究はアイデアも面白く、(完全に理解できたわけではありませんが)アルゴリズムもすばらしく研究としては非常に良い研究だと思いました。
ただ、私はwebコンテンツの推薦というのは、インターネットのコアなユーザよりもむしろ、検索リテラシーの低いライトなユーザにこそ必要なものだと考えています。なぜなら、検索リテラシーが低いからこそwebコンテンツの発見ができず、推薦がより有用だと考えるからです。しかしながら、現状SBMユーザの大半はインターネットのコアなユーザであるため、ライトなユーザ向けの推薦は難しいでしょう。そこら辺に、SBMを用いたwebコンテンツの推薦の限界を感じたりしています。さらに、現状のSBMによる推薦の研究は、計算時間を始めとしたUI面に非常に問題があると考えています。

SBMデータを用いたwebコンテンツ推薦の研究を自分でもやっているにも関わらず、こんなネガティブなことばかり書いて申し訳ないですが、これが現状だと思っています。


実は私もSBMデータを用いた推薦するシステムを試作済みで、はてブからテスト的に20万レコードほどデータを収集し、DB(MySQL)に登録しております。これは、アルゴリズム的にも佐々木さんのようにすばらしいアルゴリズムを用いておらず、もっと単純で計算量の少ないものを利用しているのですが、webページの推薦に5〜10秒程度かかってしまっています。正直、20万レコードじゃあwebコンテンツ推薦には、非実用的だと思っていて、実際はその100倍の2000万レコードぐらいは欲しいと考えています。そう考えると、DB検索時間及び計算時間が恐ろしいことになることは容易に想像がつきます。


そういった理由から、最近はSBMデータを用いたコンテンツ分類の方が面白いのではないかと考えていたりします。コンテンツ分類なら、検索リテラシーの低い、インターネットのライトなユーザにも有用ですし、GoogleやYahoo検索とは異なった視点からのwebコンテンツ発見の支援ができると思っています。
実はこれも試作済みで、データがまだ20万レコードしかないので、一部の分野に限られていますが、なかなか面白いようにコンテンツ分類ができていると自分では評価しています。


データ収集やUI周りの整備など、まだまだやりたいことがたくさんあるので、完成には後1〜2ヶ月ぐらいかかってしまうかもしれませんが、完成したらこちらのはてダで公開します。コンテンツ分類だけでなく、推薦の方もなんとかUI周りを整備して公開したいと思いますので、興味のある方は、ぜひ利用してみて下さい。