misakidex

http://cgi.mediamix.ne.jp/~t5523/user-cgi/c/misakidex.cgi

 一応、公開しておきます。(まだアルファー版)
 まだ累計ランキングが記事をこぼすバグがあるっぽいのと、
 運営のやり方が煮詰まってないけど、


 現状で、80サイトの主なニュースサイトを巡回して、ニュース記事のリンク数のランキングをやってます。
 「せかいのまんなか」とか「webで話題のもの」と同じコンセプトのサイトです。
 上記二つのいい点を併せ持ってます。
 前者は検索ができません。後者は、掲載記事数が少ないです。
 面白いのは「ランダム記事選択」
 80サイトを取得すると、だいたい平均で3000件ぐらい記事のURLが集まります。
 せかいのまんなかは最低2リンクからしか公開して無いですが、1リンクも入れると膨大なニュースがあります。
 なかには「古いニュース」が多いですが、「最新ニュース」や「へんなニュース」もまぎれてます。
 このへんが次の日に、他のサイトが扱って段々とネットで波及していくこともあります。
 なかなか最新記事を分離するのは難しいのですが
 (差分はとると楽そうですが、データーが一日で700KBとかになり、全体で3MBしか無いので、無理です。速度も落ちます)


 現在の問題は、
 プロバイダのCGIって関係で、一括巡回できないので(時間制限で途中でCGIが止まる) 
 なんで、「ユーザーが自分で更新する」サイトにしようと思ってます。
 頻繁に更新すると、取得先に迷惑なんで、
 10分タイマーを設定して、「ユーザー」が「更新」ボタンをクリックすると、順繰りに80サイトを巡回する。
 理論上は、13時間で80のニュースサイトを巡回する計算になります。


 せかいのまんなかなんかと違って、一日一回更新じゃなくて、
 随時更新型。
 時刻変更で、いったん現在のランキングを消去して、累計ランキングはそのまま加算する。
 って感じで、仕様を考えています。



簡単に使い方について(後日マニュアル書くよてい)

1. はじめのページTopNewsは「あらゆるURLの被リンク数ランキングです」
 (個人サイトの面白記事も拾えますが、リンク集のURLも混入します)
 リンク二件以上なので、だいたい400件ぐらい。


2. 二番目のTopStoriesは、商用サイトニュース限定です
 新聞、出版など営利サイトの記事限定です。


3.recent最近です(手法がまずいので動作不良っぽい)


4.LongRanking 累計ランクです(これ手法がまずいので動作不良っぽい)


5.RandomNews 1件のリンクも含めてランダムで並べます。
  すべてなので、だいたい3000件ぐらいあると思う。


6.検索 searchNews
 これ便利です。
 コツをいくつか。


6.1.初級
「世界」で検索すると「世界初」とか「世界で」とか規模のい多いニュース探せます
「まとめ」で検索すると「まとめリンク網羅記事」に当たる確率が高い


6.2.中級
「0714」などで検索すると「商業サイトの07/14の記事にあたる確率高い」
 てっとりばやく最新記事を探したり、特定時期の記事を探すのに有効。
「200307」なら2003年の07月。
(上記はあくまでURLにある手がかりを見ているってこと)新聞社のURLを見て、研究してみましょう。


 検索はURLにも有効。「cnn」ならCNNの記事。zdnetなら「ZDnet」の記事を探す。
 「artifact」とやれば、artifactを含む記事だが、artifactが報じている記事も探せる。


7.ネタを探す方法
 NCSに投稿でちょっとやってみて思った方法


 ランクの高い記事はあるいみ「既報」なんで面白みは正直無い。
 被リンク数の少ない記事で、「古くない」記事をザット見る。
 (昔メジャーな記事がランキングが落ちてることもあるので、被リンク数少ない=新着にはならない)
 で、次は、適当に検索して「チェック」
 最後は、ランダム記事選択。すべてを見るのはつらいので(なにせ3000件ですから)
 ランダムで何度かリロードして、見ておく。「なんかひっかかる記事」が見つかるかもしれない。
 (NCSなら投稿時にURL重複をチェックするので、既報を投稿は防げます)


8.最後に、カテゴリ分類が一応あります。
 これはまだ実験に近いです。みさきニュースと比べると少ないし、
 被リンク数だと「新鮮な記事」ではなくて「古い記事が上位に来る」のでやや使いづらいです。
 デジタルAVなんかは速報性が命なので、そのへんを考えて手法を研究中です。
 「商用ニュース限定」も実はカテゴリニュースの一部でやっています(辞書で判断しているんですね)

misaki ej

 おとといから作ってる「英日翻訳CGI]
 まだ全然不完全ですが、一応公開。(アルファー以前)


http://cgi.mediamix.ne.jp/~t5523/user-cgi/c/tr.cgi


 語彙が全然無いので、「辞書」を見れるようになってるので、辞書をみて「翻訳できそうな英文」で試してみてください(笑
 翻訳過程が見れるので、面白いと思います。
 もしかしたら無限ループになるバグがあるかもしれません(^^;)


 今後は、「海外ニュース取得bot」で使う。
 英語ページを和文で見るフィルターにする。
 といった利用を考えてます。
 辞書を作るのがたいへんなんで、
 だれかいっしょにやってくれる人がいたら連絡もらえればパスワードを教えますので(^^;)

 
 現状で、「関係代名詞」はまだ無理です。
 「命令文」も「Be+形容詞」以外は不可。
 例文がありますので、そのへんも参考に。

 
 RD研究と福岡市ガイドをblogbbsに移す予定なんで、いっしょに「翻訳CGIの制作」ってページを作る予定です。

松下、DMR-100Hと200Hを正式に発表

http://www.watch.impress.co.jp/av/docs/20030714/pana1.htm

 いや、2ch情報を見たときは半分デマ?とも思ってましたが、
 本当ですた。


 しかし、
 100HのMPEG4『同時』録画機能!!!!!!!!!!
 すげーーーーーーー!!!!


>D-Snap(SV-AV30)や同社製携帯電話などで再生できる。
 音声がG.726ってことはEggyでは再生不可かな。
 しかし、この機能のために、
 E100HとD-snapを買ってもいいかも。
 D-Snapって時々質屋で売ってたりするんよね。
 面白そうで買ったけど、全然使わないので手放す。
 みたいな商品の典型だし。
 デジカメとすると画素が低い。ビデオカメラの代わりにもならない。


 しかし、音声モノラルがなあ。
 それだったらシャープのザウルス向けのCE-VR1が叩き売りだしなあ(もう出回ってないかも)
 CE-VR1なら、単体で予約録画できるし、マイクロドライブも使えるらしいし。
 CE-VR1で録画して、eggyで再生。これ激安で最強。
 でも、同社のAV1がステレオなんで、『松下も音声ぐらいステレオに』して欲しかったなあ。


 しかし、松下電器。技術を見せ付けたって感じ。
 東芝機がかすんできた。


 E200Hも、GRTはともかく、G-GUIDEを搭載してくるとは思わなかった。
 一般消費者にはiEPGはしきい高いよね。やっぱ。
 クリポン搭載されてるけど、「実はライセンス料が高い」ってウワサがあったんですが、「関係ないらしいね」
 ただG-GUIDEの注意。
 東京は関係ないけど、
 地方だと、番組の配信が遅いです。
 うちは福岡市ですが、ほとんどの局が、前日にならないと「番組表が埋まりません」
 これは、買ってから気がつく盲点です。
 普通に録画しても「番組名」が入るのが面白いですが。


 ↑東芝iEPGを「定期的に取得して保存」して「番組名を勝手につける」ぐらいしてもいいのにね。原理的には出来る。

はてなアンテナにテキスト広告入る

 ソースを見ると、imgタグもあるので、クリックしないでも、
 アンテナを表示させたことも向こうに情報が行ってますね。
 公開されて無いけど、
 はてなアンテナのURLのジャンプは、直接飛ばないで、
 はてなのサーバーを経由して飛んでるので、
 どこにどれだけ飛んでるかも全部判ってるはずですね。
 アンテナ全体でのランキングはあるけど、もっと細かい情報も手に入ってるはず。
 ReadMe!みたいにソースごとのアクセスランキングもできるわけで。
 (ま、しかし自薦じゃないし、ソース元にしてみれば、いらんことすな。って話もあるでしょう)