Hatena::ブログ(Diary)

b_kの日記

2009-04-19

parasite_cache 1.0.0 リリース

09:27

ちょっと小休止

ちょっと仕事が忙しく、趣味に回せる時間が乏しいので更新滞ります(とりあえずG.W.明けくらいには再開できる見込み)

寄生型サイトへ寄生してみた

f:id:b_k:20090419091322p:image f:id:b_k:20090419091323p:image f:id:b_k:20090419091956p:image

欲しいデータは「動画ファイル」と「コメントファイル」。このうち、動画ファイル単体なら入手方法は今時いくらでもあるわけですが、一方、コメントファイルは数が価値になります。ぱらすて、コメコメ動画が閉鎖し、その結果難民の移動先がRayracやSaymove等に分散化しており、同一コンテンツに対するコメント総数10や20が散らばっているケースが散見されます。

ということで、それらを横串に検索し、コメントを統合するツールを作ってみました(珍しく今回はFirefoxアドオンじゃないのでIEでもSafariでもOperaでも動くはず)。

一言で言うと

NicoCacheの非ニコ版みたいなもんです。いやNicoCacheきちんと使ったこと無いのでわかりませんが、イメージ的に。

parasite_cache
  • サイト横断的に検索(現状の対応サイト:Rayrac, Saymove)
  • 動画のダウンロード
  • コメントのダウンロード
  • 複数コメントの統合化+ダウンロード
ファイルの場所

http://matrix.s18.xrea.com/post/parasite_cache_1.0.0.zip

http://matrix.s18.xrea.com/post/parasite_cache_1.0.2.zip

  • Saymoveで場合によってスクレイピングに失敗するのを修正
  • 再生時間とコメント数を簡易取得するように修正
インストール方法
  1. parasite_cache_x.x.x.zip をDL
  2. zip を解凍
アンインストール方法
  1. 解凍したファイルを全部消す(レジストリ未使用)
使い方
  1. 解凍したparasite_cache.exeを起動
    • プロンプト(黒い画面)が表示されたら起動中です
    • このプロンプトを落とすとparasite_cacheは終了します
    • parasite_cacheはローカルサーバとして起動します。ポート番号8089を決めうちで使います。
  2. http://localhost:8089/parasite_cache/ へ好きなブラウザからアクセス
    1. 初期画面は各対象サイトの新着動画一覧を対象にしています
    2. 画像をクリックすると右下にポップアップします。
    3. コメント統合の仕方は以下の通り
      1. 各動画の一番右のアイコンをクリックすると、その動画が選択状態になります
      2. 統合したい動画を片っ端から選択してください
      3. 画面上部の merge ボタンを押すと、実際に統合してダウンロードします

aa 2009/04/19 12:59 再生時間とかの表示はできないでしょうか?
再生時間がばらばらでしたら統合したとしても滅茶苦茶になるだけなので
できれば表示し統合の参考にしたいのですが

風 2009/04/19 13:51 お疲れ様です! 凄いですねこれw
あとは、ニコニコへの対応と長いタイトルが切れること
それと検索ワードをエクスプローラ式で登録できれば…
なんて無茶苦茶言ってみます。 m_ _m

ABAB 2009/04/19 16:02 そういえばコメコメ動画が復活してますね。

nana 2009/04/19 19:53 なんとか動画にもコメント対応してもらえるとうれしいです。

hamham 2009/04/19 21:08 削除されたニコニコ動画に対応は出来ないでしょうか?
今のところSaymoveとニコニコのふたつがコメント多いので

ねこねこ 2009/04/19 23:16 検索するとSaymoveが引っかからないような?

ffff 2009/04/20 05:46 ありがとう
これはすごい
できれば自動ローカル保存+再生もお願いします

移動移動 2009/04/20 21:00 指定されたURLにアクセスできないのですが・・・
これってポート開放とかしなきゃいけないのですか?

RASRAS 2009/04/21 00:10 Saymoveのハガレンのコメを落とそうと思ったけど
検索が引っ掛からない・・・
ttp://saymove.net/comeplay.php?comeid=1648

b_kb_k 2009/04/21 01:33 >> Saymoveで検索に失敗するバグ
1.0.2で修正しました。

>> ポート解放?
ローカルに閉じたサーバなんでポート解放は関係無いです。アンチウィルスソフトがブロックしているか、ポート番号が重複してます。特に予約済みのポート番号じゃないのであまりそういうケースはないかと思うのですが、既存のサーバでポート番号を8089にしていないか確認下さい。

moemoe 2009/04/21 04:33 1.0.2に変えたところhttp://localhost:8089/parasite_cache/ で
HTTP 500 内部サーバー エラーがでるようになりました。
(1.0.0では起動できていた)

dos窓の中は
ininja - - [21/Apr/2009:04:23:30 東京(標準時)] "GET / parasite_cache/ HTTP/1.1" 500 309
- -> /parasite_cache/

p.s.04/04の記事にコメントしたのですが見つかりにくそうなのでこちらにもコメントします。

saymoveでエラーが出て動画が落とせないのがあったのでコメントのみ落とそうとしたのですがエラーが出て落とせませんでした。
(error.mainpage)
動画がエラーでもコメントのみの保存の時は保存できるようにお願いします。

RASRAS 2009/04/23 03:43 対応ありがとうございます。私の方では検索、コメントDL共に問題ありませんでした。
ただ、コメント総数4449ある奴を落としてみると、容量が55.3kしかなく、
中身を見てみるとコメント数は470程度でした。
これはサイト側の制限とかでこんなもんなのでしょうか?
できれば全部落としたい…。ちなみに試した動画は↓です。
ttp://saymove.net/comeplay.php?comeid=1792

BBBB 2009/04/30 16:28 saymoveのアドレスが変わったようです。
http://say-move.net/

b_kb_k 2009/04/30 21:46 >> HTTP 500 内部サーバー エラー
複数回起動したとか、前回の終了時に正常終了できなかったせいでトラブったのかもしれません。こちらでは現象が再現できないため、何とも言えませんが…。

>> fxoonのsaymoveコメント保存
やれるつもりでいましたが、出来ないようですね。ちょっと確認します。

>> コメント総数4449ある奴が470しか落ちてこない
サイト側で制限がかかっているようです。あと、重複自動排除がかかっているせいで一人弾幕とかしてる人がいると1つのコメントに集約されています。

>> BBさん
ずっと落ちたままだと思ってました。報告ありがとうございます。

移動移動 2009/05/01 14:02 個人的にはコメントをすべてDLできるほうがいいです。
1人弾幕などは自分でNG設定すればいいですし・・・
なりよりコメント数が少なくなってしまうのがさみしいです。