Hatena::ブログ(Diary)

あらびき日記 Twitter

2014-03-26

日本語形態素解析の初歩

社内で LT をする機会があったので、最近趣味で MeCabソースコードを読んでいることもあって日本語形態素解析について初歩的な説明をしてみました。


今まで系列ラベリングとか勉強したことがあるくせに、日本語みたいに分かち書きされてない言語の形態素解析がどう行われているかよくわかっていませんでした・・・。

形態素解析の解説資料は色々目を通したことがあったんですが、単語分割と品詞タグ付けを合わせて系列ラベリングの問題として扱っていると思い込んでいたので「????」な状態でした。思い込みって怖いですね。


ちなみに、スライド内でチラッと言及しているダブル配列については次のエントリーが素晴らしくわかりやすいです。

情報系修士にもわかるダブル配列 - アスペ日記

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/a_bicky/20140326/1395833803