Hatena::ブログ(Diary)

WebService::Blog->new( user => ’hide_o_55’ )

2014-07-22

YAPC::Asia 2014 に応募したトークが繰り上げで採択されました

Rejectされていた トークがキャンセルが発生したために繰り上げで採択されました。

自然言語処理を支える技術 〜要素技術とPerlの活用〜 - YAPC::Asia Tokyo 2014

ということで、8/29(金) 15:00から多目的教室2で発表しますので自然言語処理に興味のある方はよろしくお願いします。

2014-07-20

LOUDS Trie ライブラリを書いた

C++ で LOUDS Trie を扱うライブラリhsds::Trieを書きました。

hideo55/cpp-HSDS ? GitHub

LOUDS Trieとは?

Level-Order Unary Degree Sequence という木構造を表現するデータ構造を利用したTrie木です。

Space-efficient Static Trees and Graphs

hsds::Trie の機能

現在は以下の機能をサポートしています。

  • 木のノードレベルでの探索(traverse)
  • 完全一致検索(exactMatchSearch)
  • 共通接頭辞検索(commonPrefixSearch)
  • クエリ文字列を接頭辞に含む全てのキーを列挙(predictiveSearch)
  • ノードIDからキー文字列の復元(decodeKey)
  • Trieのファイル書き出し、読み込み、mmap
  • TAIL配列圧縮

特に、traverse は私のユースケースでは重要なのですが、tx-trie、ux-trie 等のLOUDS Trieの実装では提供されていませんでした。

なお、hsds::Trieでは内部で使用する簡潔ビットベクトルの実装として、以前作成した簡潔ビットベクトルライブラリを採用しています。

パフォーマンス

しっかりしたベンチマークはまだとっていませんが、ランダム文字列の共通接頭辞検索でux-trieの3倍以上の速さでした。

これは使用している簡潔ビットベクトルの速度の差によるものと考えています。

2014-07-16

YAPC::Asia 2014 に応募したトークが reject されました。

YAPC::Asia Tokyo 2014 に応募していたトーク

自然言語処理を支える技術 〜要素技術とPerlの活用〜 - YAPC::Asia Tokyo 2014

が落選しました。

SNS等で応援して下さった皆様には申し訳ありませんが、YAPC::Asia 2014 ではこのトークはできません。

初めてYAPCでトークする人を優先するようなことを書いておきながら中には有望だが採択されていないトークもある件。 自然言語処理とメールに関するトークを一切採択しなかったこと。

http://yapcasia.org/2014/07/talk-schedule-is-now-available.html

ということで、今年のYAPC::Asiaでの自然言語処理の話は求められていないようなので*1、トークするはずだった内容については別の機会にでも発表しよう思います。

*1:テーマなどの兼ね合いもあるので仕方ない

2014-07-11

Clib で cpp-HyperLogLog をインストールできるようにした

C/C++ ライブラリマネージャ Clib で、cpp-HyperLogLogインストールできるようにしました。

作業としては以下の package.jsonリポジトリのトップディレクトリに追加するだけでした。簡単ですね。

{
  "name": "hyperloglog",
  "version": "1.0.0",
  "repo": "hideo55/cpp-HyperLogLog",
  "description": "C++ implementation of HyperLogLog ",
  "keywords": ["hyperloglog"], 
  "license": "MIT",
  "src": ["include/hyperloglog.hpp", "include/murmur3.h"]
}

これで以下のコマンドでcpp-HyperLogLogのソースを取得できるようになりました。

clib install hideo55/cpp-HyperLogLog

2014-06-22

Hachioji.pm # 41 に行ってきた

6/21(Sat)に開催された Hachioji.pm #41 に行ってきました。

参加者は13人でした。今回は、八王子に出来たハッカソンでも使えそうなフリースペース ヘヤニワや、Yo、YAPC::Asia TOKYO 2014 などについて話していました。

自分のLT

C++でウェーブレット行列ライブラリを書いた話をしました。

資料

LT

以下、他のみなさんのLTの雑なメモです。

@hirobanexさん
@ytnobodyさん
  • OpenVZ で docker っぽいことやる
@hkobaさん
@ichigotakeさん
@mackee_w さん
@__papix__ さん
  • 邪悪なTeng Pluginの話
@xtetsuji さん
@tsucchi さん
@moznion さん
@uzulla さん
@maka2_donzoko さん
  • いつものダジャレネタ