Hatena::ブログ(Diary)

konisimple log RSSフィード Twitter

はてなブログに移転しました!

2011年09月30日

【解消】whotwi障害情報(片思い、両思い一覧が取得できなかった件について)

whotwi - グラフィカルTwitter分析において、以下の障害がありました。

申し訳ありませんでした。

障害の内容

片思い、両思い一覧ページが表示できない

影響範囲

ユーザページの片思い、両思い一覧ページ、フォローに関する指標

障害発生時間

2011/9/30〜2011/10/1 01:55頃

原因

Twitter apiからのレスポンスが仕様通りでなかった。

friends/idsにcursorを付けないと、レスポンスにページング関連の値がついたりつかなかったりする。たぶんapiバグ

常にcursorをつけるようにして解消した。

2011年09月18日

ユーザ分析の結果ページのPVをユーザごとに記録、表示し始めました。

whotwi - グラフィカルTwitter分析ですが、ユーザの個別の分析ページの表示回数を記録し始めました。

1回表示するごとに1増えます。loadingのページでもタブの切り替えでも、リロードするだけでも、1増えます。

ほんとサクサク増えます。

f:id:konisimple:20110919012143j:image

こういう数字があるとなんとなく自分のページの数字を増やしたくなりますよねw

それで少しでもアクセスが増えたらいいな、なんてw

2011年09月15日

【解消】whotwi障害情報

whotwi - グラフィカルTwitter分析において、以下の障害がありました。

申し訳ありませんでした。

障害の内容

サービス停止

原因

DBサーバの異常

影響範囲

whotwiサービス全体

障害発生時間

2011/9/15 12:05頃〜19:45頃

2011年08月31日

xgettextで「非アスキー文字列」エラーが出る場合の対処方法

whotwi - グラフィカルTwitter分析の英語版をつくるべく、定番のgettextで多言語対応することに。

PHPgettextを使う方法については以下などを見てやってみました。

僕の場合英語があんまできないし、たぶん英語版しか作らないし、翻訳者も俺なので、msgidを日本語にしてしまいましたw

いちいちmsgidの英語考えるの面倒だしw俺日本人だしww

というわけでmsgidを日本語にしてxgettextすると

$ xgettext -f gettext.txt -k__

xgettext: index.php:26 に非 ASCII 文字列.

--from-code で入力エンコーディングを指定してください.

あちゃー。 gettext.txtは対象ファイルのファイル名を改行区切りで入れたテキストファイルです。

そこで前で上げたサイトや他のサイトにも

    • from-code=utf8

とあるので追加するもなぜかエラーが消えない。そこで

としたらエラーが消えました。そんだけです。

こういうところでハマるから怖い。


今回はたまたま勘で動いたけど、こういうのってどこみればいいの!

manにも書いてないしぐぐっても同様事例ないし。

なんかunixとかの世界の暗黙知的なとこ多すぎてなんでもないところではまるケース多すぎる。どうすればいいんだ。


今回のも俺の環境ではうまくうごきましたよレポートです。

gettextってPHPいれたときに一緒に入ったのかな。それとももともと入ってたのかな。もうわけわからん。

俺の環境

$ xgettext -V

xgettext (GNU gettext-tools) 0.17

Copyright (C) 1995-1998, 2000-2007 Free Software Foundation, Inc.

License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>

This is free software: you are free to change and redistribute it.

There is NO WARRANTY, to the extent permitted by law.

作者 Ulrich Drepper.

2011年08月07日

日本語ハッシュタグに対応しました。(正規表現よりentitiesで実装したほうがよい)

whotwi - グラフィカルTwitter分析

いままでハッシュタグ正規表現で判別していました。

ただ日本語ハッシュタグの条件は以下のように意外と複雑で、「日本語ハッシュタグ 正規表現」でぐぐった結果の多くが句読点を無視していました。

自分で書くのも面倒なので、twitter apiの「include_entities」をオンにして、その要素を直接使うことにします。

こうすることで、Twitter公式とハッシュタグの判定が変わってしまうこともないですし、同時に導入されたハングルハッシュタグなどにも対応でき、さらに将来の仕様変更にも対応することができます。

ドキュメント: GET statuses/user_timeline | Twitter Developers

ちなみに日本語ハッシュタグの条件は以下。

  • #か#で始まる
  • 前後には「全角スペース」「半角スペース」「全角読点」「全角句点」「半角読点」「半角句点」「ツイートの先頭」「ツイートの最後」
  • 全角でも半角でも英数字は半角、日本語は全角に変換されて同じ物として扱う