Hatena::ブログ(Diary)

無限花序

02014.06.13.

00:13

にしき的フォントを更新しました (Version 2.71) 。

前回更新内容をまとめたのが Version 2.56 のときなので、それ以降に追加したところなどをつぶさに示してまいります。


  • 既存のグリフの修正・調整
  • 漢字を97字追加 ; 中国簡体字なども少々
  • 「Miscellaneous Symbols」(その他の記号)ブロックの残りをひととおり追加 ; ARIB外字由来の交通記号など
  • 私用領域に、ARIB外字のうちの Unicode に採用されなかった文字を追加 (U+E290..E2C2) ; 小書きの漢字、楽器や声部を表す略号
  • 私用領域に、Biblos外字に見られる図形的な記号を少々追加 (U+E3D1..E3DC)
  • 私用領域に、Unicode に欠けている拡張ラテン文字をいろいろ追加 (U+EA00..EA42) ; African reference alphabet、English Phonotypic Alphabet、ネイティヴアメリカンの諸言語用など
  • 私用領域に、Bruce Alan Martin の考案した十六進法の数字を追加 (U+EC10..EC1F)
  • 私用領域に、MUFIの策定する文字およびMUFIに新たに提案されている文字をひととおり追加 ; 中世文献学用のラテン文字
  • 私用領域に、MUFIのキリル文字版にあたる「CYFI」の策定する文字や記号をひととおり追加 (U+F330..F3D0) ; スラヴ諸語研究
  • 私用領域に、「KreativeKorp」のフォントに見られる記号などをまたいくつか追加
  • 「Miscellaneous Symbols And Pictographs」(その他の記号および絵文字)ブロックのあたりの絵文字の類をそこそこ追加
  • Unicode 7.0 にて加わる予定のブロック「Ornamental Dingbats」(装飾模様; U+1F650..1F67F) 、「Geometric Shapes Extended」(幾何学模様拡張; U+1F780..1F7FF) および「Supplemental Arrows-C」(補助矢印C; U+1F800..1F8FF) に含まれる記号をひととおり追加 ; フォント「Wingdings」「Webdings」由来の記号や矢印
  • 私用領域に、絵文字の Standardized Variants に相当するグリフをざっと追加 (U+F0070..F00DA) ; 異体字セレクタによる表示にも対応
  • 私用領域に独自の絵文字などを多少追加 (U+FF013..FF031) ; 危険標識のシンボルなど
  • その他こまごまと手直しなど

f:id:Umihotaru:20140614000650p:image

f:id:Umihotaru:20140614000651p:image

f:id:Umihotaru:20140614000652p:image


以下、項目ごとにつまびらかな説明を加えます。



ARIB外字

ARIB外字というのは電波産業会というところが定めたデジタル放送用の外字セットで、Unicode 5.2 にてその大部分が採録されています。当フォントは以前からそれらの文字を少しずつ作字してきましたが、ずっと空白のまま残っていた文字を今回ひととおり埋めて補完しました。おもに交通関係の記号や、施設を表す絵記号です。

それらの記号のうち、絵文字っぽく表現できそうなものは絵文字っぽく、というかクリップアートっぽくデザインしてあります。

まあ、これらはあくまで「記号」であるべきで、こういうおちゃらけた作字は本来的でないといえるかもしれませんが、ともかくも当フォントはこういう方針でまいります。

f:id:Umihotaru:20140614000649p:image

ちなみに、U+26D3 CHAINS (鎖、チェーン規制) の記号はタイルパターンを意識したデザインにしてあるので、縦横に並べるとこういう鎖模様ができます。

f:id:Umihotaru:20140614000648p:image


また、Unicode に採用されなかったARIB外字としては人名や役職名に添える小書きの漢字 (「首相」「エヌ」のような) 、ならびに楽器や声部を表す括弧つきの略号があります。

これらの文字については、ARIB外字に関係する規格仕様書の中で示されている私用領域への割り当て方法に則って収録しています。

ほかのフォントでは「Windows TV ゴシック」や「和田研細丸ゴシック2004絵文字」が同様の対応をしており、それらと互換性があります (ただし、当フォントUnicode既存の文字を私用領域に重複して収めることはしていません)。

本稿執筆時現在、ウィキペディア「ARIB外字」のページには当フォントについて「Unicode5.2仕様の実装のみ。一部収録されていない文字がある」と書かれていたりしますが、今回の更新をもってARIB外字由来の文字はすべて網羅しました。



Unicode に無い拡張ラテン文字

今回私用領域に追加したラテン文字として、African reference alphabet、ならびに English Phonotypic Alphabet と呼ばれるものに含まれる文字などがあります。

African reference alphabet というのは、アフリカの諸言語の表記のために1978年ニジェールニアメで開かれたUNESCO関聯の会議にて提案され、同会議の参加者だった人物によって1982年に改訂された一音素一字を旨とするアルファベットです。

1978年版には大文字/小文字の別がありますが、1982年版ではその区別は不要と見なされて小文字だけの (というか unicase の) 体系になっています。

いずれの版においても Unicode に見当たらない文字が存在しており、それらを当フォントの私用領域に掬い上げています。

f:id:Umihotaru:20140614000647p:image


次に English Phonotypic Alphabet (EPA; 英語音標文字とでも訳しましょうか) というのは、速記法の発明アイザック・ピットマン Isaac Pitman と言語学者アレグザンダー・ジョン・エリス Alexander John Ellis が、英語を発音どおり綴ることを目的として考案したアルファベットです (以前のフォント更新記事で触れたユニフォンとかフランクリンアルファベットもそうですが、英語の発音と綴りの乖離というのはよく取り沙汰される話なので、それを是正しようという試みはことほどさように数知れずあるのです)。

現在の言語学で広く使われている国際音声記号 IPA も、遡ればこのアルファベットが原点になっています。

1840年代に発表されて以来、辞書が編まれるなど普及が図られるとともに、何度かの改訂が重ねられました。

文書 N4079 では、その各段階に見られる文字のうち Unicode に存在していないものが追加提案のためにまとめられており、当フォントではこれにもとづいて文字を収録しました。

f:id:Umihotaru:20140614000646p:image


そのほかの拡張ラテン文字として、セイリッシュ語族などいくつかのネイティヴアメリカン言語ラテン文字表記するために使われる文字*1や、ガリア語の碑文に見られる tau gallicum という文字*2を追加しています。



Martin による十六進数表記、Dwiggins による十二進数表記、平衡三進法

米国ブルックヘブン国立研究所の Bruce Alan Martin という人が1968年提言した十六進数表記法で、4つのビットをひとかたまりで図示したような16個の記号で数を表すものがあります。

常用するのはちょっと無理があったか、結局さして受け入れられはしなかったようです。

数字というものは読み誤りを防ぐためにもある程度の冗長性があるべきでしょうし、システマティックすぎて実用に向かなかった例といえるでしょうか。

ちなみに、フォントConstructium」もこの数字を収録していますが、当フォントとは符号位置がちがうので非互換です (Constructium では U+F880..F ; 当フォントではそこにはApple互換の文字を置いているので同調させるわけにもいかず U+EC10..F に)。



また、米国書体デザイナーであった William Addison Dwiggins が1932年に考案した十二進法用の2つの数字があります。

すなわち十進法でいう 10 と 11 に当たる数字で、10は X の筆記体のような形 、11は 3 ないし Ʒ を逆さにしたような形 (ときには E の筆記体のような形) をしており、十二進法の有用性を説いてその普及に努める Dozenal Society of America という団体がこれを採用して会報で用いたり、同団体の創設者のひとりである Frank Emerson Andrews が著書で使うなどしています。

これら2つの数字も Constructium に収録されており、こちらは当フォントともコンパティブルです (U+F89A..B)。

この Dwiggins の数字が X と E に似た形をしているのは、それぞれローマ数字の X (=10) および Eleven の頭文字に因んでいるということのようですが、ふつうのラテン文字「X」と「E」そのものが十二進法の数字として用いられることもあります (実例)。

なお、Dozenal Society of America は十二進法の10と11をどういう文字で表すかということそれ自体にはこだわっていないようで、10と11に「⚹」と「⌗」のような別の記号を採用していた時期もあるようです。




十二進法の数字といえば、以前の更新で私用領域に追加したピットマン氏のもの (2 と 3 をそれぞれ逆さにしたような) がありましたが、あれらは将来的に Unicode に追加される運びなので*3、そちらのコードポイントに移しました (U+218A..B)。



変わった数字としてもうひとつ。

変則的な記数法の一種に平衡三進法 balanced ternary というものがあります。

通常の三進法では各位に立つ数が 0, 1, 2 であるのに対して、平衡三進法では -1, 0, 1 の値をとります。

少々直観的でないような記法ですが、マイナス符号を用いずに負数が表せるとか、下位の桁をただ切り捨てるだけで丸めの処理 (十進法における四捨五入) をしたことになるとかの利点があるので、コンピューター技術への応用が試みられたこともあったらしいです (1958年モスクワ大学で作られた Се́тунь というコンピューターがその例)。

この記数法では -1 の値を一字の数字で表す必要があり、これにはいくつか実例があるようなのですが、たとえば「-」と「1」を組み合わせたものと見立てられる「T」が使われたり、「1」を天地逆さまにした形のものが当てられたりするようです。

フォントでは、その「1を逆さまにした形」を U+EDFF に置きました。

なお、フォントQuivira」では U+F030 にこの数字が収められています。

f:id:Umihotaru:20140614000645p:image



MUFI

f:id:Umihotaru:20140614000644p:image

以前にも触れた、中世ヨーロッパの文献研究のための特殊なラテン文字の私用領域への符号化を策定している MUFI の文字を、今回の更新でひととおり収録しました。

ただし、Unicode既存の文字の組み合わせで表現できるダイアクリティカル付きの文字については原則として除外しています (MUFIのコード表で Category 2: Precomposed characters に分類されているものの大部分)。

また、MUFI の文字は私用領域全体に散らばっているため、いくつかの文字は、当フォントにおいてほかの割り当てに沿っている文字とコードポイントが衝突するところが出てきてしまいます (たとえば U+F130 には、MUFI に則れば COMBINING LATIN SMALL LIGATURE A SMALL CAPITAL R という文字が収まるべきですが、当フォントではそこには国際SILの私用領域に基づいて FONT BASELINE AND SIDEBEARING MARKER LEFT というのをすでに置いていました)。

このようにダブルブッキングになっているもの (計16字) については、仕方なく U+EE20..F にまとめて置いてあります。

MUFI の Version 3.0 で定められている文字のほかにも、今後の追加のため新たに提案されている文字にも対応しています。コードポイントが割り当てられているものはその位置へ、そうでないものは U+EE30..3 に。


それから、この MUFI を踏まえてドイツのフラクトゥール書体筆記体フォントのために考えられた Unicode-gerechte Norm für Zusatzzeichen (UNZ 1) というものがあって、U+F500 前後あたりにいくつか独自の文字が割り当てられています。

これらは筆記体ならではの合字の類なので、ふつうのフォントがこれに対応しようとするのはナンセンスですが、それでも U+F4F7 と F4F8 の2字は当フォントでも収録してみました。

U+F4F7 は筆記体の起筆部分を符号化したもので、当フォントでは数学用の筆記体ラテン文字の小文字 (U+1D4B6..1D4CF) といちおう繫がるようにしてあります。まあ、使いみちはともかく。



CYFI

f:id:Umihotaru:20140614000643p:image

2007年にセルビアベオグラードで開かれた学術会議で採択されたスラヴ諸語の文献研究に要する歴史的なキリル文字の標準化案を踏まえた、MUFI に倣って古いキリル文字の異形などを私用領域に割り当てる提案があり、CYFI (Cyrillic Font Initiative) と呼称されています。

こちらの文書に具体的な文字や記号の割り当てのリストが示されており、当フォントはそれらにひととおり対応しました。

ただしこの文書が策定されたのは Unicode 5.2 のころで、Unicode のその後のヴァージョンで正式採用された文字がいくつか含まれており、それらは正規のコードポイントにすでに置いてあるのでここからは除外してあります。


なお、MUFI や CYFI を含めた言語学用の文字の私用領域への符号化を適切に調和させていこうというプランとして、 LINCUA (Linguistic Corporate Use Area) というものが提議されています。



KreativeKorpの私用領域

サイト「KreativeKorp」が配布するフォントの一部で使われている独自の割り当てのうち、今回は罫線のようなものなどを中心に追加しました。

U+F7CB..D にある煉瓦の模様や梯子の絵文字は並べると繫がるように作ってあります。

そもそもどういう意図でこういう絵文字が盛り込まれているのかはよくわかりませんが、まあたとえば ⬇こんな使いかたができるでしょうかね。

f:id:Umihotaru:20140614000642p:image



絵文字

f:id:Umihotaru:20140614000641p:image

今回は通信がらみ、ユーザーインターフェイスがらみのものを中心に、絵文字をそれなりに追加しています。

波の絵文字 U+1F30A WATER WAVE北斎の名画をベースにして左右がループするようにアレンジしてあります。

天の川の絵文字 U+1F30C MILKY WAY は上下左右が繫がります。

f:id:Umihotaru:20140614000640p:image

また、U+1F192..A あたりの囲み文字の類は、以前のヴァージョンでは Unicode の例示字形が示すとおりの四角囲み文字として作ってありましたが、なんだか無味乾燥おもしろくなく実用的でもない気がしたので、ソースである携帯電話絵文字により近いような字形に差し替えました。

f:id:Umihotaru:20140614000639p:image



絵文字のStandardized Variants

携帯電話絵文字が Unicode採録される際に、いくつかの絵文字は Unicode既存記号類に統合されましたが、それらを本来の記号ファンシーな絵文字と区別して表示させるために異体字セレクタを付加するという方式が取り決められています*4

フォントではこれを踏まえて、絵文字と統合された記号類のうち記号っぽく作ってあるものについては絵文字っぽいグリフを別個に作り、もともと絵文字っぽく作ってあるものについては記号然としたグリフを作って、異体字セレクタの VS15 (U+FE0E) と VS16 (U+FE0F) で切り替えられるようにしました。

これらの別体グリフは私用領域の U+F0070..F00DA にもまとめて置いてあります。

作っていない文字がまだ若干ありますが、こんな感じになります。

f:id:Umihotaru:20140614000638p:image

f:id:Umihotaru:20140614000637p:image



独自の絵文字など

f:id:Umihotaru:20140614000636p:image

私用領域の U+FF013 あたりに独自の絵文字類を多少追加しました。

U+FF019..F にはいくつかのハザードシンボルを。

ハザードシンボルとは、取り扱いに注意を要する化学物質の容器や保管室の入り口などに掲示して警告を促すもので、欧米のいくつかの規格のもとに制定されています。

Unicode にあるシンボルで同種の用途に供せそうなものと併せてまとめると以下のとおりです。

なお、フォントQuivira」では Directive 67/548/EEC にもとづく一連のシンボルが U+E070..6 に収録されています。

f:id:Umihotaru:20140614000635p:image


U+FF020 にはゴルフクラブとボールの絵文字。

ゴルフを表す絵文字は auSoftBank ではグリーンと旗の絵ですが、docomo ではこのようなクラブとボールの絵です。

Unicode ではいずれも U+26F3 FLAG IN HOLE に統合されています。

ちなみに、iPhone の絵文字では U+26F3 はゴルフボールだけを描いた絵だったこともありました。

また、携帯電話を表す絵文字 U+1F4F1 MOBILE PHONE は、当フォントではあえてちょっと古色を帯びた代物をモデルにして描いたので、時代に合わせて U+FF021 にはスマートフォンの絵文字を置きました。

ちなみに、Unicode 7.0 で追加される予定の文字の中にも Webdings フォント由来の U+1F581 CLAMSHELL MOBILE PHONE (折り畳み式携帯電話) という絵文字があるので、当フォントもその位置にそれらしいものを作字してあります。

f:id:Umihotaru:20140614000634p:image


それから、U+FF031 に Love Symbol と呼ばれるシンボルを収めました。

この♀と♂と喇叭を合成したような記号米国ミュージシャン、プリンス Prince (1958- ) が創出したもので、彼はある時期にこの発音不能なシンボルそのものを自分の名前として名乗っていたことがあります。

f:id:Umihotaru:20140614000633p:image

また、このシンボル自体をタイトルとしたアルバム1992年に出されていたりもします。

asin:B00000EZ1G


この記号が公的な文字コードに採用されることはおそらく無いでしょうけれども、漢字の分野ではたとえば「𣝣」という字が「山田 𣝣」*5という一人の人名を表記するためだけにJIS第3水準に入れられたような例もあるので、これも同じようなものだと考えられなくもないような気もします。

(プリンスの経歴を解説するためにこのシンボルがテキスト中で用いられている例: その1その2)

*1cf. http://www.pentzlin.com/Proposal-North-American-Indigenous-Letters-Draft2.pdf

*2cf. http://std.dkuug.dk/jtc1/sc2/wg2/docs/n4297.pdf

*3:Dwiggins の数字とともに追加提案が提出されたことがあります。 cf. http://std.dkuug.dk/JTC1/SC2/wg2/docs/n4399.pdf

*4:こちらの記事がわかりやすいです: http://d.hatena.ne.jp/NAOI/20120802

*5:やまだ じゃく (1920-1993)。フランス文学者で、森鷗外の孫。