携帯電話の絵文字のUnicode登録をめぐる議論の動向

「第2回ワークショップ: 文字 ―文字の規範―」において、「携帯電話の絵文字のUnicode登録をめぐる議論の動向」という題でしゃべってきた。その時スライドに書いたりしゃべったことを、以下にメモしておく。

はじめに

問題の所在

2008年12月、Googleが日本の携帯電話の絵文字をUnicodeに登録するための提案を発表したところ、Unicodeメーリングリスト上で激論が発生した(1ヶ月で600通超)。この議論の中で、しばしば反対意見の中で「規範」を持ち出した意見が出ていた。したがって、本ワークショップのテーマである「文字の規範」を考えるネタとして、おもしろいのではないかと思う。

おことわり

以下の議論の概観は、メーリングリストUnicode Public Email ListGoogle グループ)をもとにしているが、細かい議論を端折ったり、時間が離れた議論をくっつけたりしている、かなり強引、かつ部分的なものである。ベンダーなどに確認しているわけでもない。そのあたりはあらかじめご容赦いただきたい。

日本人の参加状況

  • Kida Yasuoさん=提案者の一人
  • 日本人の投稿=若干名
Google グループ

NTT DOCOMO welcomes this initiative since it will dramatically improve the interoperability of emoji. The emoji culture has grown in the mobile phone community and has been very popular. Thanks to this initiative, NTT DOCOMO also welcomes the potential of emoji to be used widely by the Internet community as well. Based on its experience, NTT DOCOMO would like to cooperate with this initiative in making the emoji culture even more popular.

当事者意識があまり感じられない?

メーリングリストにおける議論の概観

パンドラの箱”論(反対意見)

絵文字の登録は、パンドラの箱を開けることになる*1。絵文字に収録されているランドマークや国旗などは、日本の文化に強く依存した偏ったレパートリーである。いったん絵文字が登録されれば、収録されていない国/機関/企業などが絵文字への登録に押し寄せるのではないか?

日本の文化に依存しすぎ論

絵文字は、きわめて強く日本の文化に依存しており、日本人以外には理解が難しい。例えば、西洋人=金髪、あるいは中国人やインド人の造形*2は日本人から見た“外人”観に基づくだろうし、日本人の顔が顔一般を代表している*3(=例えば「日本人」を表す絵文字がない)ことからもそれはわかる。

また、絵文字は日本の携帯電話でしか使われていない。

逆に、いったんUnicodeに登録されると日本固有のものだとは思わない(日本固有の文脈を離れて使用されてしまう)のではないだろうか。

今こそ立ち上がれ!日本文藝家協会!(余談*4

かつて、激烈な反Unicodeキャンペーンを行った日本文藝家協会*5には、ぜひ今回の問題についても前回同様のアピールをしてもらいたい。

なぜなら、携帯電話の絵文字は日本の文化だからである。ケータイ小説を発表している瀬戸内寂聴氏は絵文字を使用しており*6、『瀬戸内寂聴全集』が刊行される際には絵文字が必要である。ピンクのハートをUnicodeの都合で勝手に白黒にしてもらっては、日本文化を将来に継承することができない!

また、天狗*7に“GOBLIN”などと名前をつけるのは日本文化への冒涜だ!

…とか、言ってくれないかな (^_^;;

Private Use Areaでやればいいじゃん(反対意見)

絵文字のレパートリーは携帯電話会社という私企業が決めている。Unicodeに絵文字が登録された場合、もし携帯電話会社が商業目的で絵文字を増やすと、Unicodeはそれに追随する。つまり、Unicodeのレパートリーが、企業の利益のために増えるということになる。

なんだったらCOMMERCIAL USE AREAでも作って、登録するのにお金をとれば? RFC 5241 “Naming Rights in IETF Protocols”*8という前例もあるし。

また、Googleで絵文字を検索する人はいないので、絵文字を通常の文字と同じ扱いにする必要はない。

絵文字はプレーンテキストではない(反対意見)

Unicodeはプレーンテキストのための規格である。絵文字には色とかアニメーションとかで文字の弁別をするものがある(色付きのハートとか、ひよこ/卵を割って出てくるひよこ*9とか)が、従来、文字の色というのはワープロやHTMLなどの上位プロトコルで処理されるものであり、プレーンテキストの範疇ではない。

Skype, Microsoft Messenger, Yahoo! Messenger, AIM, Gmailなどで使えるEmoticonは、「:-)」と入力すればスマイリーが出る*10と言った具合に、一種のマークアップによって実現している。絵文字もマークアップでやるべきでは?

絵文字はプレーンテキストである(賛成意見)

プレーンテキストは進化してきた。これからも進化し続けるだろう。5年後、プレーンテキストについての常識は、絵文字を許容しているかもしれない。

また、数学用アルファベットのような、スタイルの違いと言っても過言ではない文字も登録されている。

絵文字にも、通常の文字と同様、形による意味の弁別がある*11

色やアニメーションがなくても符号化は可能である。ハートのように*12色の違いをグレースケールで表現することは可能だし、アニメーションも静止画の違いで表現できる。

N3452主義(反対意見)

ISO/IEC JTC 1/SC 2/WG 2 N3452“Principles and Procedures for Allocation of New Characters and Scripts and handling of Defect Reports on Character Names”という文書がある。ここには、ISO/IEC 10646Unicodeへ文字を登録する際の原則と手続きが記されているのであるが、その中に追加すべきではない文字についての規定が見られる。

この文書の2.2 Character categoriesには「Obscure or questionable usage symbols」というカテゴリがあるのだが、意味不明な文字や文章を書くのに使われない単なる図形などの例として、ファイストスの円盤、インダス文字、ロンゴロンゴ文字、企業などのロゴ、牛の絵、回路図で使う記号、天気図で使う記号などが挙げられている。

一方、Annex H: Criteria for encoding symbols の中の H.7 Some criteria weaken the case for encoding に、シンボルを追加したくない場合の基準として、単独で用いられるシンボル(交通標識)、コンピュータではあまり使われていない記譜法(ダンス・ノーテーションなど)、一時的なシンボル、商標、単なる装飾用のシンボル、単なる絵二次元的にしか使われないシンボル(回路図用の記号など)、結合可能なシンボル、用法や使用者が不明なシンボルなどをあげている。

以上のことから判断して、牛の絵*13などが入っている絵文字は追加すべきではない。

Round Trip Conversion主義(賛成意見)

Universal character setであること、文字コードの離れ小島を作らないことがUnicodeの最大の目標である。多数のユーザを持つ文字集合である絵文字の登録は、Interoperabilityのために必要である。

Round Trip Conversion主義への反論(反対意見)

DocomoSoftbankの間のやりとりは国際的なInteroperabilityか?

Interoperabilityを犠牲にしても収録しなかった例はある。例えば朝鮮民主主義人民共和国の規格DPRK 9566-97に収録されている金日成金正日の名前を記述するための特別なハングルや、「誉れある高貴な朝鮮民主主義人民共和国軍が南朝鮮の不信心者を撃滅した場所を地図で示すためのシンボル」*14であるmilitary victoryは登録されなかった。符号化にはappropriatenessが必要である。

登録されていない文字(シンボル)集合はたくさんある。ユーザーが多いので登録すると言うのであればクリンゴン文字やMicrosoftのWingdingsシリーズ、ISO 7001 (Public Information Symbols) なども登録すべきであろう。

部分採用派(一部賛成)

登録済みのシンボルに類するものは入れてもいいのでは?(一部のシンボルは既に登録されているシンボルと重複するということでUnifyされている)。

逆に企業のロゴは不要*15

絵文字はchildish

絵文字は子どもの本にたくさん出てくる。

絵文字を使う人はリテラシー能力が低いという意見がある*16。感情などを文章で表現できないからハートマークを使ったりするのだ。

句読点もまた絵文字同様、感情を表現するために使ったりするが、句読点は疑問文を作るために「?」を使うなど、文法構造 (grammatical structures) とリンクしているので絵文字とは違う。

絵文字=ヒエログリフ*17

絵文字はヒエログリフへの回帰ではないか(漢字にも近いかも)。将来的に“Neko-mimi is moe.”と絵文字で書く人が出てくるかもしれない*18

文字とは何か?*19

どこまでが文字でどこからが文字ではないか、という境界線は確実に広がっていくので、YesかNoかで決める算入基準(inclusion criteria)の集合で定義できるものではなく、典型による基準(prototypical criteria)によって定義すべきではないか

外野が思う問題点

以上のようなメーリングリストのやりとりを外野から見ていて、私が思ったことをいくつか述べておく。

とっくに一線は踏み越えている

特にN3452主義に顕著であるが、絵文字の収録に際して原則論あるいは規範論によって反対する、という意見がある。しかし、Unicodeはすでに、原則論に反することを多数やっちゃっている。

  • 類似するシンボルがすでに入っている
  • プレーンテキスト的ではない文字も入っている(数学用アルファベットなど)
  • 特定の文化に依存する記号も入っている(宗教的シンボルなど)
  • 文字なのか不明なものも入っている(ファイストスの円盤など)
  • 規格書で厳密には表現できない文字も入っている(制御文字、点字など)

したがってパンドラの箱はとっくに開いているのだと言える。

歴史的経緯は実はあまり問題ではない*20

しかし、こういう状況であるにも関わらず、規範論が顔を出すのは興味深い。一線を踏み越えていても規範(=一線を越えてはいけない)は(ある程度)維持されているのである。これらの議論を見ていると、歴史的にどういうことがなされてきたかは、規範にとって実はあまり問題ではないということがわかる。

Cf. 當山日出夫「文字の歴史と伝統とは ―文字の伝承の視点から「祇」を事例として―」(第97回訓点語学会研究発表会レジュメ、2007年10月14日)

…文字について次のことは言えよう。どの字体が正統であるかという擬制としての規範意識と、実際に使用されてきた歴史(伝承)とは、切り離して考えるべきである、と。

ユーザーの多寡も実は問題ではない

規範論者は、絵文字のユーザーが多いか少ないかに関係なく、それが適切か適切でないかによって反対をする。そして、メーリングリストに見られる規範は、携帯電話メーカーや日本人のそれではない。

imageとsymbolの峻別

「規範」というテーマからは外れるが、imageとsymbolを峻別する考え方には違和感を持った。imageとsymbolを峻別するのはラカン的、ひいてはロゴス中心主義的ではないかと思われる。imageとsymbolとのあいだを往復するのがエクリチュールである、というデリダの批判が思い起こされる*21

*1:Unicode Mail List Archive: Emoji: Public Review December 2008 - A Very Pretty Can of Worms Indeed。ちなみに、Unicodeメーリングリストでは、折々に「パンドラの箱をあけることになるぞ!」という意見が出ている。google:site:unicode.org pandora box

*2:http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html#e-1A4

*3:http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html#e-19B

*4:メーリングリストではこんな意見は出てません (^_^;;

*5:

*6:ぱーぷるさんのプロフィール | ケータイ小説サイト 野いちご

*7:http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html#e-1AD

*8:2008年4月1日発表。

*9:http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html#e-1BB

*10:http://www.skype.com/intl/ja/allfeatures/emoticons/

*11:これに対して、意味の弁別を知っているのは携帯電話メーカーだけでは?という反論がある。

*12:http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html#e-B13

*13:http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html#e-1D1

*14:“PLACE ON MAP WHERE THE PROUD AND NOBLE NORTH ARMY CRUSHED THE SOUTHERN INFIDELS.”(Unicode Mail List Archive: Re: Emoji: Public Review December 2008)

*15:現時点では企業のロゴは互換領域扱いになっている。

*16:Unicode Mail List Archive: Re: Emoji: emoticons vs. literacy

*17:http://en.wikipedia.org/wiki/Talk:Emoji

*18:ギャル文字からの類推かなぁ。

*19:What is a character? - moroshigeki's blog

*20:コメント欄参照。

*21:hirokiazuma.com参照