「あ」に濁点

そんな文字列を発見したら、要調査ですよね（笑）
コンピュータフォレンジックということであれば、拾えるものは全部ひろっとけ！という方向ではないかと思ったりします。（ネットワーク方面だと、拾えるパケットは全部拾っとけ？）
文字列を調査する場合『その文字の組み合わせに意味があるのか？』は、人間が目で確認しないとダメでしょうね。

あ”いことは”

人間が目で見れば『合言葉』だろうと予想できますが、grep で“あいことば”してもひっかかりませんやね。それがひっかかる grep がとても欲しいですけど（笑）*1

*1:見た目が似た文字列を検索してくれるツールになるのかな？

2004-09-06

Combined form とか、

“正規合成”とかの単語に挫折中＿|￣|○
横浜へは文字コード本持って逝くかなぁ・・・

2004-09-06

正規順序

基底文字ってなんじゃらほい？と思い、Unicode標準入門(ASIN:4798100307)を開く。P119 のコラムを読んでみると、全然考え違いしているらしい＿|￣|○*1
できるのかわかりませんが、例えば「あ(U+3042)」が基底文字として、その次に結合文字が来た場合どうするか？というお話なんですかね＞[openmya:000699]
普通はそんな並びにならないんでしょうけど、dd で作成したファイルシステムのイメージだと、セクタをまたがったり、Slack space で偶然そうなったりしそうですかね。

*1:横浜へこの本を持っていくことが決定した瞬間

2004-09-06

結合

ということで？「あ（U+3042)」に、U+030E:Combining Double Vertical Line Above を結合？してみたところ。＞画像*1
U+3099: Combining Katakana-Hiragana Voiced Sound Mark を結合するべき？なのかもしれませんが、できなかったので似た文字？を選んでみました。って、そいうことが本題ではなかったり＿|￣|○

*1:もっと見た目の美しい結合パターン募集中？