Hatena::ブログ(Diary)

HM weblog

 | 

2009-03-23

  1. 昨夜は一晩中雨だった。
  2. まじかんと雑記: 活用の行は重要ではない
    なるほど。こんな感じかしら:
  3. かなと漢字だけで辭書を記述するのは正直言って苦しい。「居る」などの上一段動詞の邊りが特に。學校文法では「居る」とか「見る」とかは「語幹がない」といふことになってゐるやうだけれど、それをそのままかな漢字變換用の辭書に記述することは出來ない。「讀み」の部分が空文字列になってしまひ、辭書から其の語を引く事が出來なくなる。
  4. 「讀み」をローマ字で表記し、活用の「段」の區別を無くしてある。

    git.sourceforge.jp Git - seijiseikana/seijiseikana-database.git/commit
    違ふ、「段」ぢゃない「行」だ。一度pushしたコミットメッセージは修正できないか。できないだらうな多分。
    1. 丘の道を登り: 「助ける」と「動ける」は同じか?
    2. 丘の道を登り: 「助ける」と「動ける」は同じか? --- 続き
    3. 丘の道を登り: 「助ける」と「動ける」は同じか? --- 続きの続き
    cannadic改作者の人。
  5. 「書いて」は元々「書きて」だったのが音便化して「書いて」になったものですが、もし「kak」までが語幹なら、語幹は「変化しない部分」なのだから、音便化で「k」がなくなってしまうのはおかしいでしょう。「変化しないのが語幹じゃなかったのかよ」と言いたくなります。

    丘の道を登り: 「助ける」と「動ける」は同じか? --- 続きの続き
    あー、音便があったか。
  6. 闇黒日記

    重要なのは、名詞、動詞、形容詞、或は形容動詞の語幹ではなく、辭だ。てにをは、用言の活用語尾を何う認識して何う處理するか、だ。その部分で歴史的かなづかひの優位性を利用できなければ、何の意味もない。

  7. まじかんと雑記: 音便をどう扱うか
  8. 個人的にはあまり興味ないし知識もないのであとまはしにしておきたい、さういふ訣で

    とりあへず全部變換できるやうにしておけばいいんでない?

    2009-03-21 - HM stream
    なんて言った字音の話。だが全部は現實には不可能。今頃になって氣附いた。ツッコミが無かったらしいのが吃驚なのだが、「甲子」のやうに二文字だけならまだしもその單語の字數が増えればあっといふまに組合せ爆發が起きて扱へなくなる筈。單純に全パタン對應は無理。
  9. この表を用ゐて機械的に字音假名遣ひを發音どほりにした場合、單漢字なら良くても熟語だと「稀有」を「きょう」としてしまふ。「ゎ」は小文字だから大丈夫さうだけれども、例へば「木椀」を「もかん」と變換することもありうる。

    チャンギ日記 2009年3月
    たしかに「假名遣と假名遣の對應表」だけでは字音の境界を正しく認識できない。此の手の變換をするならあともう一つ表が必要で、それが「漢字と假名遣の對應表(單漢字辭書)」。「稀有 けう」なら、まづ單漢字辭書を引いて「稀 け」と「有 う」に分解できる。あとはこの分解された字音ひとつひとつに對して假名遣の表を引けばいい。「けう」を一纏めにして假名遣の表を引くと「きょう」になってしまふけれど、此のやうにすればさういふ心配はないよ。變換對象は入力ではなく辭書。その場合漢字と假名の兩方が揃ってゐるから、かういふことができる。
  10. 單漢字辭書は「辭書の變換」や「辭書の雛形生成」を目的としたもので、字音假名遣で入力して單漢字變換闇黒日記させるためのものぢゃないんだ。でも、單漢字辭書が出來たところで上手く辭書の雛形を作れるかといふと、どうも怪しい氣がしてきた。實際全然進んでゐないし、できたとしても所詮「雛形」だから手を加へる必要があるし。さういふボトムアップ的なやりかたを無理に指向しても良いことない。もう全部手作業でも何でもいいから適當にさっさと辭書を作って、それを應用する實裝を誰かが書ける状態にしたはうがいいな。
 |