@port139 Blog

基本的にはデジタル・フォレンジックの技術について取り扱っていますが、記載内容には高確率で誤りが含まれる可能性があります。

「あ」に濁点

そんな文字列を発見したら、要調査ですよね(笑)
コンピュータ フォレンジックということであれば、拾えるものは全部ひろっとけ!という方向ではないかと思ったりします。(ネットワーク方面だと、拾えるパケットは全部拾っとけ?)
文字列を調査する場合『その文字の組み合わせに意味があるのか?』は、人間が目で確認しないとダメでしょうね。

あ”いことは”

人間が目で見れば『合言葉』だろうと予想できますが、grep で“あいことば”してもひっかかりませんやね。それがひっかかる grep がとても欲しいですけど(笑)*1

*1:見た目が似た文字列を検索してくれるツールになるのかな?

正規順序

基底文字ってなんじゃらほい?と思い、Unicode標準入門(ASIN:4798100307)を開く。P119 のコラムを読んでみると、全然考え違いしているらしい_| ̄|○*1
できるのかわかりませんが、例えば「あ(U+3042)」が基底文字として、その次に結合文字が来た場合どうするか?というお話なんですかね>[openmya:000699]
普通はそんな並びにならないんでしょうけど、dd で作成したファイルシステムのイメージだと、セクタをまたがったり、Slack space で偶然そうなったりしそうですかね。

*1:横浜へこの本を持っていくことが決定した瞬間

結合

ということで?「あ(U+3042)」に、U+030E:Combining Double Vertical Line Above を結合?してみたところ。>画像*1
U+3099: Combining Katakana-Hiragana Voiced Sound Mark を結合するべき?なのかもしれませんが、できなかったので似た文字?を選んでみました。って、そいうことが本題ではなかったり_| ̄|○

*1:もっと見た目の美しい結合パターン募集中?

一覧表

id:hasegawayosuke さんが Unicode と日本語に関するコードページのマッピングを調べて一覧表にしてくださっています。

Unicodeと各コードページ間での変換
http://d.hatena.ne.jp/hasegawayosuke/20040905#p1

クリックしたら、そのまま文字列が表示されちゃったりして>IE
っていうか、ファイル名の途中に HTML ってあるから、HTML 文書だと勘違いしてる?HTML ファイルとして保存スナァ!>IE
ということで無事ダウンロード完了!多謝!!m(_ _)m

もちろん読んでますよ!

と表明しておこう。っていうかコメントの書き方を調べてない怠け者な私(スンマセン)

バイト列に意味はあるのか(01)
http://slashdot.jp/journal.pl?op=display&uid=4421&id=248520

フォレンジック方面のツールでは、printable でない文字列を削除する strip*1 なんてコマンドもあったりするんですよねぇ。このコマンドが具体的どの文字を削るのかは調べてないんですが・・・