2011年08月07日
日本語ハッシュタグに対応しました。(正規表現よりentitiesで実装したほうがよい)
- 日本語ハッシュタグに対応しました。
ただ日本語ハッシュタグの条件は以下のように意外と複雑で、「日本語ハッシュタグ 正規表現」でぐぐった結果の多くが句読点を無視していました。
自分で書くのも面倒なので、twitter apiの「include_entities」をオンにして、その要素を直接使うことにします。
こうすることで、Twitter公式とハッシュタグの判定が変わってしまうこともないですし、同時に導入されたハングルハッシュタグなどにも対応でき、さらに将来の仕様変更にも対応することができます。
ドキュメント: GET statuses/user_timeline | Twitter Developers
ちなみに日本語ハッシュタグの条件は以下。
トラックバック - http://d.hatena.ne.jp/konisimple/20110807/1312711171
リンク元
- 174 http://b.hatena.ne.jp/entry/erockr.com/
- 173 http://www.google.co.jp/imgres?imgurl=http://cdn-ak.f.st-hatena.com/images/fotolife/k/konisimple/20100310/20100310141901.png&imgrefurl=http://d.hatena.ne.jp/konisimple/20100310/1268200240&usg=__aCo70FDfhz7L_-0FfUp9He83XQM=&h=616&w=705&sz=932&hl=ja&start=4
- 94 http://www.google.co.jp/url?sa=t&source=web&cd=1&ved=0CBkQFjAA&url=http://d.hatena.ne.jp/konisimple/20110307/1299504113&rct=j&q=標準偏差 体重&ei=felATruFKaneiALHlrSwBQ&usg=AFQjCNGak4eUPPimlF7j2
- 54 http://image.search.yahoo.co.jp/search?p=グラビアアイドル+工口画像&ei=UTF-8&rs=1
- 54 http://images.google.co.jp/imgres?imgurl=http://cdn-ak.f.st-hatena.com/images/fotolife/k/konisimple/20100310/20100310141901.png&imgrefurl=http://d.hatena.ne.jp/konisimple/20100310/1268200240&usg=__aCo70FDfhz7L_-0FfUp9He83XQM=&h=616&w=705&sz=932&hl=ja&star
- 32 http://image.search.yahoo.co.jp/search?p=エロ画像&oq=&ei=UTF-8&xargs=0&pstart=1&b=81
- 26 http://search.yahoo.co.jp/search?p=年齢別平均体重&search.x=1&fr=top_ga1_sa&tid=top_ga1_sa&ei=UTF-8&aq=&oq=
- 26 http://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&rlz=1T4ADRA_jaJP425JP426&q=グラフ 曜日
- 24 http://d.hatena.ne.jp/
- 21 http://search.yahoo.co.jp/search?p=身長別 平均体重&search.x=1&fr=top_ga1_sa&tid=top_ga1_sa&ei=UTF-8&aq=&oq=