勝手に将棋トピックス RSSフィード

 | 

2008年05月05日

[] 「もずいろ」がつながらなくなっています

だいぶ前から、「もずいろ」にアクセスできない状況になっています。申し訳ありません。

原因は不明ですが、サーバ全体が利用不能になっているようです。仕方ないので本格的に移転を検討しますが、作業する時間はしばらくとれそうにないので、もう少しお待ち下さいますようお願いします。

[] メールアドレス変更

都合によりメールアドレスを変更します。以前のメールアドレスも当面は有効ですが、今後は下記のアドレスへお願いします。なお、メールチェックの頻度が下がっているので、メールをいただいてもお返事がままならないこともあると思います。

  • 新アドレス:mozuyamaここに記号を追加してくださいyahoo.co.jp

[] アンテナにいろいろ追加

久々にいろいろと手を入れました。

  • プロ棋士 他」カテゴリを新設しました。対象とするページは以下の通りです。
  • 多数のページを追加しました。
    • 登録できるページ数の上限を100だと思いこんでいたのですが、2年近く前に200に拡張されていたことに最近になってようやく気付いたので、これまでなら登録しなかったページも登録してみるようにしました。様子を見ながら少しずつ増やしていければいいと思います。なお、最近は新しいところの開拓をあまりしていないので、見落としているページも多いと思われますので、推薦は歓迎です。(ただし、対応は遅れてしまうと思います。すみません。)
  • 更新されているのに上がってこないページの設定を修正しました。これについては、下で解説します。

「更新されているのに上がってこない」現象

勝手に将棋アンテナをご利用になっている方には、「更新されているのに上がってこない」ページがときどきあることにお気づきの方もいらっしゃるかと思います。これは、I know.に特有の原因も含まれているため、どうしてそういうことが起こるのかわかりにくいと思いますので、ここで一度説明しておきます。

登録先に拒否されている

I know. のアンテナは、アンテナ登録を拒否する方法をいくつか提供しています。

いったん登録された後に、登録先のページでこの設定がなされた場合は、アンテナはそれ以後の更新を検知できなくなります。これは登録先の意志によるものであり、仕様通りの動作です。例えば、コンピュータ将棋協会blogはこれに該当します。5月7日追記:コンピュータ将棋協会blogが上がってこない状態になっているのは、別の原因のようです。申し訳ありません。(現時点では原因不明です。)

登録先への巡回が停止している

ページの更新が頻繁でない場合、アンテナの更新頻度はだんだん下がっていく仕様となっているようです。そして、更新がずっとないページは、最終的に定期的な更新が中止されてしまいます。こうなった後に更新が再開された場合、その再開を検知するのは長期間先になることがあります。ただ、きちんと確認はしていませんが、そこまで更新間隔が開いていないのにこのような状態になることがあるような気がします。(登録先のサーバ不調などでつながらないことがあると、こうなってしまうのかもしれません。)

5月6日追記:I know Tips. - Comaneci_bot の巡回仕様によると、現在は最低でも24時間に1度は巡回する仕様になっているようです。したがって、上記の記述は誤りです。申し訳ありません。ただし、このようなことになるページがそれなりの頻度で発生していることは確かです。やはり、つながらない場合に巡回が停止されてしまうのかもしれません。

この状態になっているかどうかは、次のような手順で誰でも確認可能です。さらに修正可能な場合もあります。

  1. リンクの右側にある携帯電話のアンテナのようなアイコン クリックしてみて下さい。
  2. 「I know. - サイト情報」というタイトルのページが出てきます。
  3. 「このアンテナが巡回しているページ」という部分の右下にある「[巡回履歴]」というリンクをたどります。
  4. すると、アンテナが更新をチェックした履歴がわかるページになります。直近の日時とともに「定期巡回」と書いてあれば正常です。
  5. もし、「定期巡回停止中」と書いてあったら更新チェックが行われない状態になっています。
  6. その場合、「[巡回依頼]」というリンクをクリックして下さい。これで、手動による巡回が行われます。
  7. しばらくして上がっていれば、めでたしめでたしです。

ただし、こうしてもうまく行かない場合もあります。以下でさらに説明します。

更新範囲設定の不具合

ページによっては、ページ全体の更新を見るのではなく、一部分のみの変化を検知するように設定していることがあります。例えば、テキスト形式の広告が入るページなどです。

この設定では「ある文字列から別の文字列まで」というような指定を行うのですが、トリガーとなる文字列が変更されてしまうと、何もないところを指定していることになってしまう場合があります。こうなると、その後何があっても更新を検知できません。これは、私がログインして設定を変更しなければ修正できません。

ただし、いわゆるブログなど、フィードの配信があるページではそちらを利用することで、このような不具合を防ぐようにしています。この不具合が生じるのは新聞社系のページが多いように思います。

データの不整合

I know. が内部で保持しているデータに何かおかしな部分があって、更新がうまくできなくなることがあるそうです。

上記の手順で、最新の巡回履歴が「1970年」になっている場合がこれに該当します。こうなった場合、I know. に連絡すると修正してもらえるらしいですが、私の経験上、更新範囲設定を変更してやることで復帰できるようなので、現在はそうしています。(やはり、私がログインすることが必要です。)

この症状は、だいぶ前の大規模な障害時に多数のページに発生したのが始まりでしたが、その後もぽつりぽつりと新しく発生しているので、データベースのおおもとで何か問題が起こっているのかなと思うのですが、よくわかりません。

山田 剛@CSA山田 剛@CSA 2008/05/06 19:04 第18回世界コンピュータ将棋選手権から帰ってきたばかりでうちのブログの名前を思わぬ形で見て、非常にショックを受けています。
うちのブログは100%広報目的ですので、巡回を断るようでは存在意義ゼロです。
robots.txtも置いていませんし、metaタグはContent-Typeとgeneratorしか設定していません。
ただし思い当たるフシはありました。今までAkismetスパムフィルタを使っていたのですが、これが日本語に厳しいらしく、私が自分自身の記事に送ったtrackbackでさえspam扱いしてしまいます。これは自分でspam判定を解除すれば有効になるので、致命的ではないのではないかと思っていましたが、それにしてはAkismet導入後にtrackbackを他のサイトからもらえたことがありません。

そのため取り急ぎ、スパムフィルタを変更しました。Spam Karmaが日本語に優しいという評判を聞き、試用中です。
相変わらず巡回を拒絶するようであれば、追加の対策を施します。
例示していただいたおかげで気づいた次第です。ありがとうございます。

mozuyamamozuyama 2008/05/06 20:10 コメントいただきありがとうございました。単に、
http://www.computer-shogi.org/blog/robots.txt
が存在しているためかと思っていたのですが、よく見ると現在の書き方では拒否されていないですね。現在、アンテナの編集画面では「ページにアクセスできない」と言われてしまうのですが、アンテナの側でこの解釈を誤っているのかもしれません。お手数をおかけして恐縮ですが、もし差し支えないようでしたら、上記のファイルを削除していただくと巡回されるようになるかもしれません。調査不足で書いてしまい申し訳ありませんでした。

山田 剛@CSA山田 剛@CSA 2008/05/07 00:22 CSAのwebmasterに頼んで、blog/robots.txt を読み取り禁止にしてもらいました。
CSAブログがどのように見えるかお試しいただければ幸いです。

ただ、これが原因でクロールされないというのは不思議です。
CSAブログはWordPressを使って作成されているのですが、WordPressは公開方法の設定にかかわらずrobots.txtというファイルがあるかのように振舞う(少なくともURL書き換え許可状態では)ようなので、robots.txtがあるというだけで巡回を諦める仕様だとすると、WordPressベースのブログの多くはI know. アンテナクローラに見捨てられていることになると思います。

山田 剛@CSA山田 剛@CSA 2008/05/07 00:26 ↑書き忘れましたが、最初のコメントで「robots.txtがない」と発言したのは私の勘違いで、実際には2番目のコメントに書いたようにrobots.txtファイルを外部に見せかけています。失礼いたしました。

mozuyamamozuyama 2008/05/07 11:03 お手数をおかけして申し訳ありません。試してみましたが、相変わらずアクセスできないと言われますので、アンテナの運営元に問い合わせてみました。最近レスポンスが遅いようなので日数が掛かるかもしれませんが、回答がありましたら直接ご報告差し上げます。

 | 
<< 2008/05 >>
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
2003 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 |
2008 | 01 | 02 | 05 | 06 |
2009 | 01 | 03 | 05 |
2011 | 04 | 09 |
2012 | 02 |
2013 | 05 |
Connection: close