メモ。

 ちょうど

コンピュータ―知的「道具」考 (NHKブックス (478))

コンピュータ―知的「道具」考 (NHKブックス (478))

が届いたところで、これから読みます……明日には
古武術介護入門[DVD付](古の身体技法をヒントに新しい身体介助法を提案する)

古武術介護入門[DVD付](古の身体技法をヒントに新しい身体介助法を提案する)

が届くはずで、両者を読みきるまで日記が滞るかもしれません。

続きを読む

漢直メモ。

 

コンピュータ―知的「道具」考 (NHKブックス (478))

コンピュータ―知的「道具」考 (NHKブックス (478))

のp.108まで読んだ。
 ──で、とりあえずメモ。


 漢直を「漢字1文字単位」ではなくて「かな漢字変換辞書に載ってる漢字列単位」で記述することはできるだろうか……。
 それで居て、「かな漢字変換のみ」→「かな漢字変換にたまに漢字を交ぜる」→「漢直もどき」へと移行できるような……いきなり漢直ではなくて、「かな漢字変換の知識をほぼ生かしつつ、かな/ローマ字配列をインデックスに使いつつ、かつ漢直もどきへ」という感じで。
 「漢字直接入力」という表現方法は適切ではないのかもしれない。あえて言うのならば「漢字直接指定」なのかも。


 たとえば、こんな感じで打鍵する。

打鍵コード S-d R-s R-. S-d d 思う
対応する文字 dプレシフト dポストシフト 「おも」「う」→「思う」
メモ 多段シフト開始 飛鳥21c290 飛鳥21c290 多段シフト終了 飛鳥21c290 漢字かな交じりで未確定まま


 通常の漢直においては「かなと漢字の打鍵コストが同じ」が通常。
 でも、同時打鍵系をやっていると「かなに2アクション掛けるのは許容できない」気がしてくる……って、JISかな系でも似たところがあるのかもしれない。
 昔書いた「漢触こーど」では文字を覚えられなかったから、それをかなに置き換えてしまおう……という話。
 単漢字ごとに読みを指していては入力効率が良くない(それをやるなら単漢字IMEの「風」を使うほうが便利)ので、いっそのこと方向性を変えて「かな漢字変換辞書にある漢字列」を割り振るほうが良いのかも……と。


 プレシフト・ポストシフト用のキーについては、親指シフト+SandSでの運用を考慮して「飛鳥のキー使用頻度に基づきシフトキーを割り当てる」あたりが適当かもしれない。


 紙・電子媒体に関わらず、いわゆる辞書を用いて漢字の読みを調査するようなことはしない(それをやろうとした黄砂配列は遅々として進んでいない……私にできる作業範囲を明らかに逸脱している気がするので)。
 (公開場所は「えもじならべあそび」にするとして、)GPLかな漢字変換辞書──SKK辞書とか──を加工してしまうのが一番良さそう。
 五段活用で使われる子音英字は削除して、「入力文字列」と「出力文字列」に共通する「送り仮名」を両方から削除すれば、「かな→漢字対応表」が一発でできる……のだろうか。かなり安直な考えなので、実際にうまくいくかどうかは不明だけれど。


 SKK辞書一例(SKK-JISYO.Lより)

あいs /愛/
あいr /愛/
あいk /愛/
あいi /相/

 ここから英字を省いて、重複しないもののみを抽出する&スラッシュを除去する。

あい 愛
あい 相

 先頭と末尾に(超多段シフト方式日本語入力システム「風」のような考え方で)スペース+英字を割り付ける。

{ k}あい{ k} 愛
{ j}あい{ j} 相

 上記の状態(かなをかなのままにしておく)でリリースする……この状態では「繭姫/姫踊子草」用定義にアドオンできない。
 実際に使う場合は、上記の定義を「エディタの置換機能」を用いて「全てのひらがなを(アドオン先の配列による)打鍵ストロークに置換してから」各配列の定義へとアドオンする(……これをやるために、定義中から不要なひらがなはきちんと削除しておく必要がある点に注意)。
 たとえば、飛鳥カナ配列21c290へとアドオンする場合は、次のように置換することになる。

{ k}{Ld}{k}{ k} 愛
{ j}{Ld}{k}{ j} 相

 この定義を「飛鳥21c290」の定義にアドオンすれば、

{Ld}{k}と打鍵──ひらがなの「あい」
{ k}{Ld}{k}{ k}と打鍵──漢字の「愛」
{ j}{Ld}{k}{ j}と打鍵──漢字の「相」

という感じで分別出力できることになる。
 ……こうすれば、「漢触こーど」と同じく「スペースキーと文字キーの同時打鍵」を使わない配列であれば、必ずこの定義をアドオンできる。


 仮に「スペースキーではなくて、右シフトに割り当てたい!」という場合は、はじめに「{ 」という文字を「{R」にプレ置換してから、その後に「ひらがな→ストローク変換」をすれば良い……と。もちろん、左シフトに割り当てる場合は「{L」にプレ置換すれば良いことになる。


 ……って、ホントにこんなので実用になるのだろうか^^;。
 とりあえずメモのみ。

補足。

 従来の漢直は「始めにコードの習得ありき。解らない漢字だけをかな漢字変換(漢直Winとか)で」なのだという捉え方をしています。
 ……で、今日のメモは全く逆順の考え方で「始めにかな漢字変換ありき。漢字を特定する余裕がある部分だけを漢直で」という方向性のものです。


 かな漢字変換方式では「常に辞書を引きながら文字入力している」のだけれど、それと「漢字直接入力」との間に「(漢直Winのような)漢直寄りのかな漢字変換アプローチ」だけではなくて「かな漢字変換寄りのアプローチ」もあっていいんじゃないかな……と。
 #それで「漢直もどきよりも漢直Winを利用する漢直のほうが楽じゃん!」と思ったのならば、それはそれで移行すればいいだけの話でしょうし。


 ──p.116まで読んだところで、補足が必要なことに気づいたので、引き続きメモ。
 例字はほぼ書籍からお借りしています。

  • 漢字を読むときには、漢字を「ピクチャ」として捉えている。
    • たとえば「花」は「くさかんむり/イヒ」だけれど、これは「イヒ」のみの「化」と同一の意味を成しては居ない。
      • 漢字を部品で入力する方法に慣れた人であれば別だけれども、そうでなければ「花」と「化」の類似性を意識する機会は(文字を書く瞬間を除けば)あまりないのかもしれない。
    • たとえば「簡単」の「簡」は「たけんかむり/間」だけれど、「簡」と「間」の類似性は「同じ音を指し示すことがある」程度だったりする(語源云々は別として)。
      • 漢字をストロークで入力する方法に慣れた人であれば別だけれども、そうでなければ「簡」と「間」の類似性を意識する機会は(文字を書く瞬間を除けば)あまりないのかもしれない。
  • 漢字熟語を読むときには、漢字熟語を「ピクチャ」として捉えている。
  • 「銀座・銀行・銀幕・銀河・銀貨」はそれぞれ始めに「熟語としての意味」を連想させる。
    • これらに共通する「銀」という漢字から連想しうる「単漢字としての意味」を常に伝えるとはかぎらない。


 ……漢直になれた経験がある方であれば「そんなわけないだろ……」という感じかもしれませんが^^;。
 これらの感触は「使っている入力方式に引きずられる」性質があるのかも……似たようなことは「かな漢字変換」でもありえますな。

  • 音声を「かな漢字変換に通せるかな文字」に直して捉えることに慣れすぎている。
    • たとえば「手伝う」と打とうとして「tezudau」と打ってしまった人が居た場合に【いや、「z」じゃなくて「s」でしょ】とか言ってしまう……しかも「そうなる理由を説明し忘れている」。
      • 普段やっているから、「それがそうなる理由を説明する必要があるかもしれない」ということについて気づけない(注:今日私がやってしまったミスなのですよ……)。


 ……習熟初期段階の人が迷うこと・習熟途中段階の人が迷うことをよく観察することで、何かヒントが見えてくるのかも。


 そういえば、もう一つ。
 p.94には、【小さな子供には、左右鏡面対象の文字(ある特定のフォントにおける「さ/ち」とか)が分別できない】という話が。
 動物として生きていくうえでは「左か右か」は識別できる必要があるけど、同じく動物として生きていくうえでは「鏡面対象のものを分別する能力は必要はない」からなのかも。
 「大人になると【さ/ち】を分別できる」ということは、逆に考えれば「それを区別しようと意識しなければ、人間は鏡面対象のものを区別することができない(または取り違えてしまう)」ということにもなる。
 ……鍵盤の鏡面対称位置を誤打してしまったりすることがあるのは、案外とこういう「生きていくうえで必要のない技術は習得しづらい」という、かなり根本的なところにあるのかもしれない。誤打を防ぐには「そもそも片手のみで文字入力を行う」とか、「鏡面対象を上手に利用して配字し、早期に違いを分別できるようにする」とか、あるいは「トコトン練習しまくる」あたりが有効……と。


 そういえば、「日本語は漢字を読むだけで速読っぽくなるけど、英語とかではそういうことはできない」という気がしていたのだけれど……漢字の熟語に関するネタを見るに、これはどうもハズレっぽい気がしてきたり。
 そういう言語では、「文字のまとまりで語としての意味を捉えら易いように、文字のフォントがデザインされている」……と。
 「カナモジカイ」が設計した「カナモジ書体」の話を思い出しつつ。


 そして……pp.164-166、親指シフトキーボード。
 始めは50音順近似(チョイかな入力親指シフト版みたいなもの)で実験して、指がらみを防ぐために頻度順配列へと変更した……と。
 単独・連接頻度は集計済みのものを使用。内訳は漢字熟語約3千語と話し言葉約15千文字……大体23千文字ぐらいだろうか。
 「小指は動かしにくいからホームポジションに固定……その代わりに頻度の高い文字を割り当てた」などと書いてある。
 濁音・半濁音同置の件については特に書いていない。ただ「濁音は逆手親指シフトと同時打鍵・半濁音は小指シフトと同時打鍵」という、操作説明のみが記されている。


 ……とりあえず読了。
 www.ykanda.jpをダウンロードして読むのと同じぐらいの情報量だろうか。
 前半の引用系ネタは「後半を読み解くための知識」らしく、確かに必要だと思った……けれど、誤解のままかかれていることもある(JISX0208の適用範囲とか)から、引用系の部分についてはきちんと調べつつ読むほうが良いかも。


 #pp.82-84「重さではなく色で天秤の傾斜が決まる【色天秤】」は、予備知識のない小さな子供は理解できるけど、それ以上では学習しきれず混乱するだけ……らしい。