Hatena::ブログ(Diary)

konisimple log RSSフィード

はてなブログに移転しました!

2010年03月25日

wikipediaの項目から名前,生年月日などを取得して返すAPIがあるといいよね

wikipediaの項目から名前,生年月日などを取得して返すAPIがあるといいよね。

手順

  1. APIコール(例:ほしのあき)
  2. ほしのあき - Wikipediaの内容を取得
  3. 上で取得した情報をパースして生年月日や年、血液型などデータベースにできそうなものを取得
  4. 上でとった情報をデータベースに格納
  5. APIとして結果を返却

課題

  • wikipediaでは生年月日とかは一応テンプレに沿って書かれてるけど、ジャンルによってそのテンプレが違うから、それをAPIで吸収しないといけない。
  • 著作権法上の問題(リンクしとけばOKなのかな?)

2010年02月07日

グラビアアイドル画像検索サイトを作ります!

大学が春休みに入って暇なので、グラビアアイドル画像検索サイトを作ることにしました。

仕組み

  1. FlickrAPIを叩いて返ってきた結果を表示。
  2. 写真の表示回数を記録してランキングをとる。
  3. サクサク落とせるようにする*1

アイディア

  • amazonで写真集とかのリンク載せてウマー
  • ヤフオクの検索結果も載せたらいいかも!
  • これは儲かりそう!上二つで十分な感じなのでCPC広告は載せない
  • ターゲットは中高生なので携帯版を作る。できればiPhone版も作りたいな。

競合、同じようなサイト

懸念事項

  • パブリシティ権の侵害?*2
    • あくまで「検索結果」だから問題はないはずだと思うんだけど、、、どうなんだろう。

とりあえず作ってみた

flickrいじる練習に以下二つを作ってみた。パソコンで眠らせておくのはもったいないので、一応公開しちゃう。

こういうのが一晩か二晩で作れるようになったのは俺も少しは成長したんだなと思う。

わかったこと

2010年01月04日

新しい検索エンジン(もどき)を作る

検索エンジン(もどき)を作ることにした。

「もどき」ってのは検索結果自体はAPIからとってくるからです。

コンセプト

  • アドオンとかグリモンとか入れなくても、デフォルトで一通りのことができちゃう!
  • 検索結果のページ(いわゆるSERP)をいろんなUIで試せる

UIアイディア

  • 自動ページ送り(AutoPagize)
    • アドオンとかグリモンいれてまで自動ページめくり求めてないなぁ、みたいな人多い?
  • 左フレームに検索結果、右フレームにリンク先
    • 昔のIEの検索タブですよね。今でも使ってる人いるのでは?あれ結構便利だったのにな
  • 大量のアクション(メニュー)
    • 検索エンジン3社のキャッシュへのリンク、魚拓、WayBackMachine、alexaとかへ
      • ごちゃごちゃにしないでどうすれば使いやすくなるかがポイントw
  • 設定は画面遷移なしで
  • 色合いの変更(Yahoo!Japanトップみたいに!)
  • 設定覚えとく機能!

名前

  • 「検索エンジン研究会」*1か「検索エンジンUI研究会」*2かな
    • なんか「なんとか研究会」って響きがかっこいーなと思って。
    • 略して「検研」とかwうーん。変か。
    • 名前についてはもう少し考えよう
    • (09/1/5追記)「サクサク検索」てのはどうかな!今のところ同じ名前はなし。略してsakukenとか「さっけん」みたいな感じで!
    • 名前難しいなぁ。かっこいい名前思いつきたい。

お金にする方法

  • 広告貼る
    • amazonとヤフオク
      • この2つを検索キーワードと連動させたときのCTRとコンバージョン率やばい!
    • kauli
      • 安定してクリ単価15円。あざす。
    • 無難にGoogle AdSenseはたぶん・・・無理だよね

懸念

  • 作るとしたらcoreserverだけど、負荷に耐えられるのかな。こんな503エラーばっか出すサーバーで非同期処理するのは危険か?
    • まぁ、作る前から負荷の心配するほど使われないかw

*1:現時点で"検索エンジン研究会" - Google 検索で現存しないことを確認した

*2"検索エンジンUI研究会" - Google 検索で0件

2009年12月26日

RSSが更新されたらメールを送る、twitter更新、デスクトップに通知、ホームページで表示する「RssToAction」

RSSが更新されたら

  • ブログへ更新(xml-rpc?)
  • 指定されたアドレスにメールを送る
  • twitterへ投稿

するサイト。

シンプルな感じ。便利そう。

既にあるかな?

名前はGoogle先生で0件を確認。

2009年12月23日

twitter列車運行状況速報は困難。

以前twitterの電車遅延関連のポストから遅延情報のメール配信 - konisimple logという記事を書きました。

要するにtwitterの書き込みを監視して電車遅延速報を出そうという企画ですね。

公式発表に出ないような5分とかわずかな遅れもわかる!と思ったのですが・・・

実際にやってみた

実際にしばらく電車遅延関連のtwitterのポストをしばらく抽出して保存してみました。その結果をまとめたのが以下のページです。

Twitter路線運行状況監視所

これはGoogle App Engineの練習とPythonの習作をかねています。

  • twitterのapiは古い投稿は検索できないので、定期的にログをとってくる必要がある
  • 本当に電車運行に関する情報を抽出するには形態素解析とかしないと!
    • →めんどう!そこで「遅れ」「遅延」「運転見合わせ」などのキーワードをまずとってきて、その中から路線名が入ってるものを抜き出すという方法で実装
  • 路線のリストは都道府県の路線一覧 XML / JSON | おもちゃ箱 | 駅データ 無料ダウンロード 『駅データ.jp』を利用。json本当にらくちん。すぐ書けた。
  • 路線名が同じ場合は区別できない。東京メトロの東西線と関西のJR東西線など。
    • まぁ実験なのでそれは気にしない。

結果・わかったこと

  • 出てくるデータは公式サイトの情報からとってくるbotばかり。
  • ほとんどの人は5分とか軽微な遅れはtwitterに投稿しない。
    • twitter中毒みたいな人たちはそういうのも逐一書くんだと思ってましたw
  • 間違った結果もかなり出てきました。

ということでこの企画は断念します。

上のGAEアプリはこのまま放置することにしますw