小林龍生『ユニコード戦記』

ユニコード戦記 : 文字符号の国際標準化バトル 東京電機大学出版局、2011年6月

★一言感想メモ

  • 身の引き締まる思いになって、同時に気持ちが高まった。もっと早くに読んでおくべきだった、と思ったけれど、異体字リスト編集後のいま(読んだのは11月)だからこそ実感を持って頷けるのかもしれない。と考えると、良い時期に読んだかもしれない。
  • まるごと勉強になる本だった。[文字]とは何か、[文字]と<文字>の関係と文字表の意義、ユニコードとJISの歴史、ユーザーと情報通信技術の専門家の対話と課題の解決方法、標準化との向き合い方、国際標準化活動の現場の雰囲気、などなど。
  • 標準化の重要性をここでも再認識。そして、こういう戦いがあったからこそ快適に生活できるのだと感謝。
  • 文字の標準化はユニコードのような国際的な場でやる必要があるのだと納得できた。私たちだけでがんばろうとしてもダメ。ただし、この本に登場するような専門家にはなれないとしても、専門的な知識を持っておく必要はあると思う。でなければ仕事にならない。
  • 自分の仕事に応用できることがいくつもあった。戦略や戦術の必要性については、出張のときにちょうど語ってもらった。この点はまだ抽象的な理解しか持っていないけれど、これから具体的な動き方を見る機会がありそうでわくわくしている。
  • 英語、英語、と思った。まずすぎる。

★抜粋(ページ)、要約[ページ]、→の右側は感想。

  • 偉人(46)
    • 小池建夫さん:歩く漢字コードの字典
    • 佐藤敬幸さん:歩く国際標準化の歴史
  • 仕事での戦い方BY佐藤敬幸さん
    • 「とどめの刺せない反論を紙で出すなんて、敵に塩を送るようなもんだ。傷を負わせたら殺せ。見逃せば自分が殺される。せめて最終局面で、意表を突いて口頭で爆弾発言するぐらいしなきゃ」(46)
    • 「どんなに自分たちの主張が正当なものであっても、適切な戦略や戦術がなければ、国際的な戦いの場では無力に等しい」(47)
    • 「他の国々に原則論を勧めておきながら、日本だけ例外をゴリ押しする身勝手は許されない」実装コストがかかるとしても、それこそが、日本がグローバルな情報化社会で協調的に生き延びていくためのコスト。こうして、JIS X 0213:2000のレパートリーは、まがりなりにもすべてUCSに対応付けられた。[74]
  • 効果的な英語レッスン
    • 用意した英字新聞かウェブの記事のサマリー(キーワードやキーフレーズにマーカー)を自分の言葉で説明、サマリーは添削してもらう(後日の場合も)。先生からの質問に答える。文法や語彙について、公的な場の発言というフォーマルな印象を与える言葉、意味的にはほぼ同じでもポジティブな印象を与える言葉とネガティブな印象を与える言葉といった微妙なニュアンスの違いを教えてもらう。[134-136]
    • アジェンダが同じ!効果的だったなと思っていたけれど、間違っていなかったと思えてなんとなくほっとした。またの機会のためにもメモ。
  • 社会言語学の常識(これを考慮しないと根拠脆弱な主張となってしまう)(163-164)
    • 話される言葉は、組織立った教育なしに母親から獲得することが可能である。まさに、母語母語とよばれるゆえんである。
    • 文字は、何らかの形での教育を経なければ獲得は困難である。文盲の存在が、そのことを如実に物語っている。
    • 古来、文字行政は権力者による支配の手段として用いられてきた長い歴史がある。
    • 言語や文字の使用者集団の境界と近代的国家の境界(国境)は必ずしも一致しない。
  • 文字コードの意義
    • 活字に組まれた形の再現性が必要なのであれば、画像データとして保存再現すれば良い。電子的な翻刻の効用は、一般的な内容の再現に留まらない。それは、検索の利便性が圧倒的に高まる、という一事に尽きる。[100-101]
    • 検索の問題の背後には、情報の交換という、より本質的な問題が存在する。それは「ある符号によって表される文字が、情報を送る側と受け取る側で同じである」という了解ないしは保証が必要だということである。送り手と受け手の意味の共有を支えるのは、ある言語を共有する社会全体の無形の合意である。文字や言葉に関わる規格とは、このような社会的な合意を、健全な蓋然性を伴うような形で、明文化したものと言えよう。コンピュータや通信においては限定された範囲での保証となるが、そこを逸脱する創造的な営為によって社会が変化すれば、規格もまた変化していくことでその存在意義を全うすることができる。[102]
  • 文字と標準化
    • 活版印刷の時代、活字箱に納められていた字母の種類は数千種に限定・正規化されていた。そして著者も編集者も読者も、文選工たちによる手書きから活字への変換を、所与のものとしてごく自然に受け入れていた。[207]
    • 漢字の異体字は、利用局面は書き手によってさまざまな変異があり、その数はゆうに1000を超える。[226]
    • 機械と人間の接面にある問題。それは情報技術と言語文化の狭間の領域である。言語の表記形([文字])とそれに対応する記号の列(<文字>)との対応関係には曖昧性、一意に解決することが不可能なアポリアの介在する余地が存在する。この関係は、言語世界を構成する要素全体と、その指し示す世界を構成する要素全体とが互いに支え合う構造となっているのと同様な困難さを持っている。何らかの視点で強引に[文字]の社会的曖昧さを排除して情報交換用符号化文字集合の符号位置=ビット列を当てたのが<文字>である。文字表の[文字]は参考情報にすぎないが、これこそがビット列である<文字>と[文字]をつなぎ止めるか細い絆なのである。[197-199,215]
    • 人名・地名に用いられる漢字の字形については、情報交換用の符号としての意味とは異なる、何らかの感覚的・情緒的なこだわり、唯一無二性、アイデンティティの確認といった意味があることは、認めなければならない。この唯一無二性の意識と情報交換用符号化文字集合というきわめて実利的な技術標準の折り合いをどうつけるか。[210-211]
  • 次のような原則で、二つの相容れない立場の妥協・合意を形成[204-205]
    • 技術標準を提供する側は、利用者側の立場や感情を尊重し、利用者側が要求する結果を実現するための技術的な手段を提供する(解決策例:音価は等しくても表記形が異なるものについては、その表現に必要なビット列の長短にかかわらず、公的に固有の名前を与える:Unicode Standard Annex #34 Unicode Named Character Sequence)
    • 利用者側は、要求する結果を実現する具体的な方法については技術的意見を差し挟まない(解決策例:ある表記形に対応する内部のビット列の長短や表示のメカニズムには拘泥しない)
  • 標準化活動の流れ
    • Ideographic Variation Sequence(IVS)は、アイディアをUTCに提案してから実用的な普及段階に入るまで12年かかった。[222-235]
    • 2008年末、ユニコードの普及に伴い、UTCでの議論の多くは、実装面での他の規格、たとえばHTMLやXMLを軸とするインターネットの世界、構造化言語の世界とどう整合性をとっていくか、符号化文字だけではなくユニコードを使って言語文化依存要素をシステムに実装していくために必要な情報の収集と公開といった議論に移行。JIS X 0213の制定と改訂に伴いユニコードとの整合性を確保。[235-236]
  • 専門性と相対化
    • 専門性こそが情報通信技術者社会の中で生き延びていくための資産であり、戦うための武器なのだ。(165)
    • しかし自戒を含めて振り返ってみると、何よりも困難なことは、自分の持てる武器装備を相対評価する能力をもつことではなかったか。みずからの戦闘能力を相対化して知ることが戦場で生き延びるための要諦なのだ。たとえ、それが名誉ある撤退につながったとしても。(166)
  • 利用者と技術者
    • 佐藤敬幸さん「だから、大切なことは、自分たちで考えた実装方法をがむしゃらに提案するのではなく、どういうことを実現したいかをていねいに説明することなのです。ぼくはいつでもその橋渡しをやります。ドアはつねに開けておきます」(160)
    • 実ユーザーと情報通信技術の専門家集団との対話がいかに困難かということ。半可通の知識は、要求を明確にするうえでは必ずしも役に立たないこと。最も必要なことは、実ユーザーと専門家集団が真摯に話し合い、相互理解を図ること。(161-162)
    • →利用者部門とシステム部門がもっと話し合うこと、を思った。利用者部門は自分たちがほしいものは何かを良く話し合い、必須の要件をしっかり把握した上でまとめること。システム部門はそれを実現するための技術を把握し、利用者部門の提示する要件を必須のものから実現していくこと。