Hatena::ブログ(Diary)

無限花序

02013.02.13.

にしき的フォントを更新しました (Version 2.50) 。

内容は以下のとおりです。今回は「Private Use Area」ブロックすなわち私用領域に大幅に手を入れました。

模様替えや、さまざまなソースからの文字の追加を行っています。


  • 既存のグリフの修正・調整
  • キアスやアーヴ文字などの収録位置を移動 ; 詳細は後述


f:id:Umihotaru:20130211174026p:image

f:id:Umihotaru:20130212210239p:image


というわけで、今回私用領域を大幅に拡充させるにあたり、まず既存のいくつかの文字群の収録位置を移動させました。具体的には下記のとおりです。こういうのを後からガサガサいじくりまわすのは好ましくないことも承知しておりますが、他フォントとの互換性や今後の拡張性などを見据えてこのように計らいました。

  • キアスを U+16000..16070 から U+E080..E0FF へ
  • アーヴ文字を U+F7D0..F7FF から U+F4D0..F4FF へ
  • 制御文字の表示形を U+EF00..EFFF から U+E400..E4FF へ
  • にしきシェル立ち絵を U+E000..E0FF から U+FFE00..FFEFF へ
  • ヴァージョン番号表示用のグリフを U+EFFF から U+F800 へ

このうち、キアスの新たな収録領域はいろいろな人工文字の類を Unicode の私用領域に割り当てている非公式規格 CSUR (ConScript Unicode Registry) に基づくものです。ただし文字のレパートリー自体はより新しく改訂されたこちらの提案書 に沿っており、同文書の並びのとおりに同じくキアスを収録している「Constructium」などのフォントと互換性があります。フォント「Code2000」「Code2001」もここにキアスを収めているものの、古いヴァージョンの割り当て案に基づいているためこれらとは非互換です。



つづいて、このたび私用領域に追加したものの数々についてひとつひとつ説明を加えてまいります。



テングワール Tengwar

f:id:Umihotaru:20130212210240p:image

テングワールはキアスと同じく、英国ファンタジー作家J.R.R.トールキン John Ronald Reuel Tolkien (1892-1973) が自身の創作である『指輪物語』などの舞台となる世界〈中つ国〉Middle-earth で使われる文字として作り上げたもので、作中ではフェアノールというエルフが創出したことになっており、クウェンヤ Quenya やシンダール語 Sindarin といったエルフ言語 (いづれもしっかりとした体系を具えた架空言語です) を書き表すのに用いられます。


この文字は子音字に母音を表す符号を付加する形で表記するアブジャドに似た書法をとり、記述しようとする言語が語末に母音が来やすいCV型 (たとえばクウェンヤや日本語) か、語末に子音が来やすいCVC型 (たとえばシンダール語や英語) かによって母音符号の付加のしかたが変わるというおもしろい特徴をもちます。そのほか、母音独立した文字によって綴られる例 (前掲画像下部参照) もあります。


また、テングワールの数字は十進法と十二進法の双方に対応しており、アラビア数字などとは逆に下位の桁ほど左のほうに書きます (たとえば1024は4201のように表記) 。


テングワールも CSUR における割り当てがあるのですが、それの改良版に相当するこういう文書、およびさらにそれに手を加えたこちらの提案が存在しているので、当フォントではその両者の和集合のようなかたちで収録してあります。

Constructium」や「Everson Mono」、および Free Tengwar Font Project で配布されている各フォントなどと互換性をもつ一方、「Code2000」などはキアスと同じく古い割り当てに基づいているためにやはり非互換です。

なお、キアスと並んでテングワールも Unicode領域だけは暫定的に確保されています (U+16080..FF) 。



ユーエル文字 Ewellic

f:id:Umihotaru:20130212210241p:image

ユーエル文字は Doug Ewell という人が1980年発明し、自身のサイトで公開している人工文字で、もともとプライヴェートな秘密文字として英語を書き表す目的で作ったものだそうです。しばらくは特に呼び名も無かったらしく、それどころかいったんは使うのもやめてしまっていたそうですが、のちに Unicode の収録内容をとおしてさまざまな書記体系のことを知ったり、あるいは人工文字を蒐集する CSUR の動きに触れるなかで自作文字への情熱が再燃したらしく (かようなわけで、 Unicode や CSUR の存在があってこそ育まれた人工文字といえます) 、1998年にはこの文字に自身の名前からユーエリック Ewellic と命名した由。キリル文字 Cyrillic alphabet が聖キュリロス Saint Cyril の名を取ってそう呼ばれるのに倣ったそうで、したがってその和訳語キリル文字呼称を踏まえてここでは「ユーエル文字」としておきます。

もともと英語のための文字でしたが、のちに文字の追加などによって仏独伊西およびエスペラントの各言語が不足なく表記できるように整備されています。


文字の形はルーン文字やキアスに想を得て作られています。多くの文字が互いによく似ており区別しにくいものもありますが、もともとが暗号的な用途のものであったことを考えればさもありなんと言うべきでありましょう。


この文字は発音どおりに語を書き表すことを原則とする音素文字であり、同じ単語でも発音のされかたによって綴りが異なることがありえます (話者や方言による差異、あるいはフランス語リエゾンなど) 。ただし IPA のように厳密な音声表記を意図したものではないので、ひとつの言語の中で音素の弁別に関わらない異音については捨象されています。


ユーエル文字には16個の数字があり、十進法のほか十六進法による表記も可能となっています。


この文字もまた CSUR において符号化されており、当フォントはそれに沿って U+E680..CF に収録しています。ほかにユーエル文字をサポートするフォントとしては「Code2000」や「Fairfax」があります。



ユニフォン Unifon の拡張文字

f:id:Umihotaru:20130212210242p:image

英語用の人工文字であるユニフォンの基本的なアルファベットは当フォントではすでに実装済みでしたが、それ以外にもいくつかのネイティヴアメリカン言語を表記するために導入された文字や、あるいは改定を重ねる中で廃字となったもの、および小文字というかスモールキャピタルが存在しており、文書 N4195 ではそれらがまとめられています。


フォントでは CSUR の割り当てに沿う形で E740..6F に基本的なユニフォンの文字を収録していますが、それに続ける形で拡張文字群を追加しようとしても直下にソルレソルやヴィジブルスピーチ領域があるために余席がありません。

そこで拡張文字についてはくだんの提案書の文字表であてがわれている私用領域のコードポイント (これ自体は深い意味があって設定したものではないと思われますが) にそのまま従い、U+E8A0..FF に収めました。


また、同提案書で U+E8B5 と E8B8 に置かれている文字は元の資料を見るかぎりそれぞれ U+E88C と E8B3 の単なるデザイン違いと思われるので (小文字も同様) 、当フォントではオミットしています (実際、のちに提出された N4262 ではこれらの文字はしれっと無かったことになっており、Unicode のメールリストでもそのへんにつっこみを入れられているのが確認できます) 。


それから同提案書では U+E8E1 を U に下線がついた形の YOU という文字 (音価 [ju]) 、E8E2 を U に上線が被さった DO という文字 (音価 [uː]) としていますが (大文字のほうも同様) 、これは現行のアルファベットの排列や CSUR の割り当て (U+E761..2) とは逆であり、CSUR に沿ってユニフォンを収録している「Everson Mono」などのフォントも上線付き U 、下線付き U の順で並べているので (Quiviraフォントは違いました) 、当フォントもそちらに倣っています。

どうもこの2つの文字は歴史的にも混同があったようで、ユニフォンで「ユニフォン」と綴ったときの頭文字も下線 U ではなく上線 U が使われている資料も見受けられます。



デンマークノルウェー語方言音声記号スウェーデン語方言音声記号、初期教育アルファベットなど

f:id:Umihotaru:20130213173515p:image

文書 N3555 では、ドイツオーストリアデンマークノルウェースウェーデンの諸方言を専門的に表記するための特殊なラテン文字や、ウラル語族研究にかつて用いられた文字、はたまたジェイムズ・ピットマン James Pitman (1901-1985) という人が1960年ごろ発明した英語の初期教育用アルファベット Initial Teaching Alphabet, I.T.A. に見られる文字、それから雷雨の中で凧揚げをした逸話で有名なベンジャミン・フランクリン Benjamin Franklin (1706-1790) が英語の綴りを発音に沿うよう是正すべく考案したいくつかの独自の文字、といったものが UCS に追加されるべく提案されています。


フォントではこの提案書に見られる文字群を U+E900..CF に収録しました。

ただしドイツ語方言用の文字は今やより整理された形でUnicodeの Latin Extended-E ブロックなどに入ることになっており、当フォントでも収録済みなので除いてあります。

また、ほかのソースから UCS に提案されたりしていて当フォントに別途収録済みのものと重複するいくつかの文字も除外しています。



トナル・システム Tonal System 、デュオディーナル・システム Duodenal System

トナル・システムというのはジョン・W・ニュストレム John W. Nystrom (1825–1885) というスウェーデン系アメリカ人が1859年に、演算度量衡、暦、貨幣などの体系を十六進法を基礎として新しく立て直すことを提唱したもので、その内容は著書 « Project of a New System of Arithmetic, Weight, Measure and Coins, Proposed to Be Called the Tonal System, with Sixteen to the Base » のなかで詳述されています。

Project of a New System of Arithmetic, Weight, Measure and Coins, Proposed to Be Called the Tonal System, with Sixteen to the Base.

彼の提言によればたとえば1年の暦は16ヶ月から成り、1日は16時間に分割されます。

数はすべて十六進法なので16個の数字を必要としていて、0から8までは普通のアラビア数字と同じですが、十進法でいう9から15には独特の数字が当てられています (やや紛らわしいことに、トナルにおける1010アラビア数字の「9」のような形をしています) 。また数には固有の名前がつけられており、0から順に noll, an, de, ti, go, su, by, ra, me, ni, ko, hu, vy, la, po, fy, ton となっていて、1016 を ton と称することが Tonal system と呼ばれるゆえんです。


トナル・システムによる新たな体系構築の試みは音楽の分野にも及んでおり、従来のト音記号などに代わるものとして5つの音部記号が導入されていて、それぞれカント記号アルト記号、トレブル記号テナー記号バス記号と称します。これらはそれぞれ1オクターヴずつ違った音階を示します。


このトナル・システムの数字や音部記号についてはこちらのサイトで私用領域 U+E9D0..EF への割り当てが提案されているので、当フォントもそれに従いました。

なお、テングワールやユーエル文字のところで触れた CSUR (現在では事実上更新が停止中) を独自に拡張したものとして UCSUR というのが呈示されており (つまり Unicode からすれば非公式規格の非公式規格) 、こちらでは CSUR に追加するかたちでさらにいくつかの人工文字の類が符号化されています。そのなかにこのトナル・システムの文字もあるのですが、割り当て位置が前述のサイトとは異なっており U+E8E0..FF となっています。


また、ニュストレムは後の1875年には、新たに十二進法を基礎としたデュオディーナル・システムというものを著書 « A New Treatise on Elements of Mechanics Establishing Strict Precision in the Meaning of Dynamical Terms » のなかで提案しています。

A New Treatise On Elements Of Mechanics Establishing Strict Precision In The Meaning Of Dynamical Terms

こちらについては前述のサイトでは触れられていませんが、このデュオディーナル・システムでも十二進法による表記のために0から9までのアラビア数字のほかに10と11を表すまた違った数字が見受けられるので、その2つを当フォントでは U+E9EA..B に収め置きました。


また、速記法などの開発で知られるアイザック・ピットマン Isaac Pitman (1813-1897) (先ほど触れた I.T.A. の発明者ジェイムズは彼の孫です) もまた1860年ごろに十二進法による数の表記を提案しており、「2」と「3」を倒立させたような文字を十進法でいう10と11に当たるものとして用いています。当フォントではこれも U+EA0A..B に収録しました。

f:id:Umihotaru:20130212210244p:image



エルヴェ・バザンの句読点

フランスの作家エルヴェ・バザン Jean-Pierre Hervé-Bazin (1911-1996) がエッセイ « Plumons l'oiseau » のなかで提案した風変わりな句読点があります。

これらは文末に付けることでいろいろな感情を表すもので、まあようするに日本語でいう (笑) だの (泣) だのと似たようなものです。

具体的には以下の6つがあり、当フォントではこれらを U+E9FA..E9FF に置きました。

  • 親愛符 point d'amour : 2つの疑問符が向かい合って見つめ合い、ハート形を形づくっているもの。親愛の情を表す。
  • 確信符 point de conviction : 感嘆符を十字に変形させたもの。信念のこもった発言を表す。
  • 威厳符 point d'autorité : 感嘆符に日傘を掲げたような形で、威圧的な物言いを表す。
  • 皮肉符 point d'ironie : ギリシア文字のΨをあしらい、弓につがえた矢にも見立てられる符号で、皮肉をこめた言葉を表現する。
  • 歓呼符 point d'acclamation : 両腕を挙げた姿、あるいは掲揚された2本の旗の図案化。いずれにしろ勝利(ヴィクトワール)の V を想起させるもので、歓呼の叫びを表す。
  • 懐疑符 point de doute : 逡巡するように屈折した疑問符で、疑いに満ちた発話を表す。

f:id:Umihotaru:20130213173516p:image


なお N4256 にてこれらの句読点UCS 追加提案も行われています。



国際SILの私用領域

国際SILは少数言語研究などを行っている団体で、その中の NRSI (Non-Roman Script Initiative) と称する部門ではその目的に供するためのフォントが配布されているとともに、Unicode に無かった文字を補うために私用領域に独自の割り当てを策定しています。その領域は U+F130..F, F170..F26F, F300..F, F320..F という範囲にわたっており、それらの文字の大多数は後から Unicode に入れられているのですが、なんらかの理由で採用されなかったり提案が行われていないものもあり、当フォントでは SIL の私用領域に見られて Unicode に存在しないそれらの文字をひととおり収録しました。

特筆すべきものとして、スーダンのコアリブ語 Koalib language でアラビア語からの借用語に用いられる「@」のような字母や、『ロングマン現代英英辞典Longman Dictionary of Contemporary English で話者によって発音に揺れのある母音をひとまとめに表すために使われている発音記号などがあります。

f:id:Umihotaru:20130213111845p:image


なお U+F1F1..9 の、アフリカ言語研究で用いられる9段階のピッチを表す記号は後述するMUFIの私用領域記号とコードポイントが重複するため、当フォントではちょっとずらした位置の U+F1D1..9 に収めています。



MUFIの私用領域

MUFI (Medieval Unicode Font Initiative) は中世ヨーロッパの文献研究のために、Unicode に不足している特殊なラテン文字などを私用領域に割り当てるプロジェクトです。

登録されている文字はダイアクリティカルマーク付きの文字をはじめとして、いくつかの領域 subrange に分類されつつかなりの数に上りますが、当フォントではとりあえず subrange 2, 4, 8, 9, 10, 11 および 12 に含まれるものを、Unicode に存在する文字を除いてひととおりカヴァーしました。

古文献に見られる独特の形状の句読点や、ヨーロッパ各地の歴史的通貨記号などです。


また、韻律の表記に用いる記号で MUFI に採録されていないもののフォントALPHABETUM Unicode」に収められているものがあるので、それも少々拾い上げています。

f:id:Umihotaru:20130213111846p:image


MUFI が符号化している文字というのは私用領域の全域にわたって散らばっている感じなのですが (「TITUS Cyberbit Basic」や「Junicode」といった先行フォントとの互換性を確保するためにそうなっています) 、今回当フォントに追加した文字群はおおむね F100..F2FF および F700..1F のあたりに点在しています。



Appleの私用領域

Apple は私用領域 U+F700 以降に固有の制御文字や記号類の割り当てを定めており、Mac用のフォントにはこれに基づいたいくつかの外字が収められていることがあります。

フォントはこのうちの U+F802..4F に配されている記号や絵文字類に対応しました。いくつかの矢印や、フォント「Hoefler Text Ornaments」に由来する飾り模様などです。


また、Appleフォントは U+F8FF に (コマンドキーを表すなどの用途で) 林檎のロゴマークを置いていることが知られていますが、当フォントではその位置には CSUR の割り当てに基づいてクリンゴン紋章 KLINGON MUMMIFICATION GLYPH が収まっています。その代わりとしてU+F89C..F に、WindowsMacキーボードに見られるような、それっぽい何かを収めておきました。あくまでそれっぽい何かです。


ついでにキーボードシンボルとして、N4317で提案されているものから U+23FB..C の2つ、ならびに U+F59E に電源のシンボルを追加しました。

f:id:Umihotaru:20130213111847p:image



KreativeKorpの私用領域

KreativeKorp」は人工文字や文字コードに関するおもしろコンテンツをいろいろと擁しているサイトで、前述の UCSUR もここの手になるものです。

同サイトで配布されているフォントのために、私用領域の U+F700..FF独自の割り当てが行われており (一風変わった文字や記号が多いです) 、当フォントではそのうちの、フォントの種別を示すアイコンなどをカヴァーしました。

f:id:Umihotaru:20130213111848p:image


ところで余談をひとつ差し挟んでおきますと U+F7E4 は八方向を示す矢印ですが、ちょうどこういう記号が、マイケル・ムアコックの一連の小説エターナル・チャンピオン〉Eternal Champion シリーズを源流としてファンタジー創作などの分野で「混沌」を意味するシンボル Symbol of Chaos として取り扱われていたりします。



Quiviraの私用領域

フォントQuivira」はトランプの地方札やフェアリーチェスの駒記号をはじめとして、いろいろと個性的記号の類を私用領域に体系的に収めています。当フォントではそのなかから数学記号ライセンスを示す記号などをいくつか採録しました。ただしコードポイントが当フォントのテングワールの領域と軒並み衝突しているため、Quivira 自体とは互換性のない位置に置いてあります。

f:id:Umihotaru:20130213111849p:image



国旗の絵文字

auソフトバンク携帯電話絵文字に見られ、Unicode に直接的には入らなかった10ヶ国の国旗の絵文字を U+FE4E5..E に置きました。このコードポイントは Google携帯電話絵文字の国際標準化のために策定した emoji4unicode でのもので、ほかのフォントでは「和田研細丸ゴシック2004絵文字」などがこの位置に国旗を収めています。

f:id:Umihotaru:20130213111850p:image



その他

f:id:Umihotaru:20130213111844p:image

以前に囲碁棋譜記号として黒丸や白丸に三角や四角を配したものを作り収めましたが、ほかにも丸やバツ印を付した記号が使われることもあるようなのでそれらも追加しました。プレイステーションのボタンではありません (そういう用途もありでしょう) 。


あとは、U+FF010..2 に独自の記号を3つほど。

U+FF010 は漫符的な渦巻き。DoCoMoソフトバンク台風の絵文字 (U+1F300) はこういう感じの字形です。

U+FF011 は手書き的な丸印。U+2713 のチェックマーク ✓ や U+2717 のバツ印 ✗ に対するものとして。あるいは禅の思想における「円相」の図像。

U+FF011 は輪っかのある惑星の絵文字です。