クメール文字入力(1)

次の関連記事:クメール文字入力(2)-Unicode方式、Limon方式

私の仕事の一部にコンピューター管理が含まれているが、すこし厄介なのがカンボジア語入力の設定である。新しくパソコンを購入したときや、Windows XPに新たにユーザーを追加したとき、そして「***(字の名前)が出ない」とスタッフが言って来た時などは、設定が必要である。

カンボジア語入力・表示にはいくつかの方式があり、互いに互換性がない。うちのオフィスで使われているのがLimonフォントを使う方式なので、この方式に従った設定を行うことになる。

パソコンでカンボジア語文字をどのように入力・表示するのかを説明する前に、そもそものカンボジア語文字(クメール文字)の表記法について乱暴にまとめると次のようになる。

カンボジア語の文字(クメール文字)について

文字の構成

カンボジア語は、子音文字と母音記号が組みあわせて書かれる。ター(おじいさん)さんという語はtを表す子音字にaaを表す母音記号をつける。

母音記号

母音記号は22種類あるが、記号によって書かれる位置が異なる。子音の上、下、左、右に書かれたり、左右、上下が組みになって書かれるものもある。組になる場合は、子音字を母音記号がはさむように書かれる。(赤色が子音、青色が母音記号

子音字の連続

カンボジア語では、子音が連続して書かれる場合、2つめは、脚文字という異なった形の子音字が使われる。
下の左の例は、k にあたる子音とその脚文字(kの脚文字は、1つめの子音字の下に書かれる)
真ん中の例はsにあたる子音とその脚文(sの脚文字は、1つめの子音字の右に書かれる)。
右の例はrにあたる子音とその脚文字。(rの脚文字は、1つめの子音字の左に書かれる)。この場合、脚文字は左側についているが、2番目の子音である。


日本語の単語は、殆どが「子音+母音」の単位の組み合わせで構成されていて、子音が続く「子音+子音+母音」という音節はあまりない。しいて言えば、「キャ、キュ、キョ」/kya, kyu, kyo/などが「子音+子音+母音」になっている。(ya, yu, yoを母音と分類する立場もあるが。。。)
しかし他の言語では、子音が続くのはめずらしいことではない。たとえば英語も子音が頻繁に連続する。(brother /br/, spring /spr/, strange /str/)

さて、クメール文字で実際に子音+子音+母音と全部を組み合わせると次のようになる。
左 kru(先生)、右 kdau(暑い)

kruは、文字は一番左に/r/次に/k/そしてその下に/uu/が書かれている。文字の固まりの中では、文字/記号の書かれる位置にかかわらず、子音字->脚文字->母音の順でよむ(k->r->u)

3子音の連続

カンボジア語では、まれに子音が3つ重なる単語があるが、このばあいは脚文字を2つ書く

厳密に考えると、上の例では、/ng+k+r/ /s+t+r/だが、もし/ng+r+k/、/s+r+t/という単語が存在した場合、区別がつかなくなる。実際にはそんな言葉が存在しないのだか、将来 外来語を表するのにそのような組み合わせの子音を含む単語が出てくるかもしれない

記号

子音文字、母音記号に加えて、単語により記号がつく。記号は通常文字の上に書かれる。記号は発音に関係するものが多い。。
左から3つめの「サヨークサニャー」記号は、文字の文字の間に書かれる

右端は、下につく記号の例。母音記号のoと見た目は同じだが、機能としては記号である。クビア・クラオムと呼ばれる。実際にパソコンに打たれる時は、母音記号のoを代用することが多い。Unicode式の場合は自動で処理される。その他に下につく記号としてヴッラムという記号があるとされるが、あまりにも特殊であるし、また他の表記方で対応できるためクメール語フォントのなかには通常含まれていないようだ。

字の固まりの区切り

基本的な字のかたまりは、子音+(子音)+(子音)+母音である。子音+子音+母音+子音と子音で終わる単語は、子音+子音+母音のかたまりのあとにつづけて最後の子音だけを書く。(かたまりとしては二つ)
(s-r-o|k 国/ ph-s-aa|r市場 -最後のrは発音しない)

母音記号を書かない単語もある。(するどいオー, ゆるいオー, あいまいで短いア/オなど) ---これはパソコン入力の際にはどうでもいいことである。---

クメール語では単語と単語の間は区切らない。これはある程度単語を知らないと、どこから単語が始まっているのか見当すらつかない。

単語を区切らないということは、パソコン処理の視点から見ると、辞書がないとワードラップ処理ができないことになる。しかしカンボジア語の辞書などまだ整備されていないので、単語の途中で次の行にまたがる際は、自分で単語の切れ目で改行かスペースを入れる必要がある。あとでレイアウトを変更して一行の長さが変わると、全部手で改行を直していかないといけないので大変である。

(この問題を解決するために、幅が0の「空白文字」というのが提案されているらしい)

このつづきは d:id:fuentebella:20061105 です