そろそろUnicodeについて一言いっておくか
文字コードの標準化について日記を書いたのだが、内容がいまいちだったのでボツにして気を取り直してUnicodeについて一言いっておくことにする。先日、といっても昨年(2008年)の10月なんだけど、その中でちょと文字コードの標準化について話をしている。*1
もう1つ自分の経験としてあるのが、漢字の文字コードがあるんですけど、番号で言うとJIS X 0208とか0212とか規格の番号で皆言うわけなんですけど、実は1988年にその日本語の文字コードの改正の委員会にいたんですね。
その当時、私は 30歳ぐらいなんですけど、「富士通」とか「日立」とか「NEC」の部長さんぐらいの偉い人たちが来てて、私なんか外資系で且つ30前後のぺーぺーだから、全然格下なんですよ。
そういうところで議論の主軸を担ってるのは、「富士通」「日立」「NEC」「日本IBM」「東芝」「沖」、外資でいえば「ユニシス」とかの錚々たるベンダーの方と印刷業界の方、それから国立国語研究所の先生とか、そんなような方々がいて、一応この業界で標準作るわけです。
当時は先程お話した通り垂直統合型だから、建前では「標準を作りましょう。標準があればみんな便利ですね」と言うんだけど、どの会社も実は自社の拡張部分があって、文字コードといってもJIS X 0208を素直にインプリメントしてる会社はなくて、メインフレーム用の文字コードが拡張漢字を持っていたから全然互換性があるわけないんですよ。
だから建前では「標準作りましょうね」みたいなこと言うんだけど、メインフレームは如何にして文字コードをロックインして自分のお客さんのスイッチングコストを高くするかということにエネルギーを注ぐわけですよ。
私なんかそういう事情を知らないから「標準化か、みんな理想に燃えてて素晴らしいな」なん思っちゃったわけですよ(笑) しかも外資系だから、そういう空気分かんないわけですよ。30のペーペーのお兄ちゃんなんだからね。それで皆さん大人の言葉を喋ってて、私はもうちんぷんかんぷんなんですね。
それでその0208の改正をするということの意味は2つあって、技術的なものもあるんだけど、もう1つは 0208では足りない文字があって追加要求が来てますということなんですね。でも追加要求が来るっていうことは、「富士通」や「IBM」や「NEC」だって「三菱」だってみんな拡張文字を持ってるんだから、知ってるわけですよ。当たり前の話なんだけどね(笑) だけどX 0208の約6000文字から7000文字に関しては塩漬けで、ここに更に6000文字とか7000文字を新規に追加するのはとんでもないと、本音を言ったらそういうことなんですよね。
自分たちのプロプライエタリな文字コードとかあるから、それから新規に追加した文字コードに移行しようなんて初めから本気で思ってないんですね。
20年前だったら絶対言えない本音を時効が来たのでばりばり言っている。上の発言は20年前だったらオフレコでも多分言えない。若い人は上記の歴史の証言を生まれていないからスルーしちゃうけど、時代は垂直統合と言って、メインフレーマーがハードウェア(メインフレーム)からOSからコンパイラからRDBMSからミドルウェアからアプリケーションのインテグレーションから運用まで一切合切握っていたというころである。
ユーザーをロックインして、スイッチングコストを高くして、利益を確保するというビジネスモデルである。かつての日本のメインフレーマーは、IBMに追いつけ追い越せでハードウェアやOSをいかにパクって、ユーザーを自社ハードに引き寄せるか、そのような商売をしていた。日立製作所と三菱電機の社員がIBMのOSのソースコードを違法に米国国外へ持ち出そうとして逮捕されたりした時代である。
本音と建前の標準化の世界である。
それで、私はそういう事情を全然知らないから「そうか6,000文字とか7,000文字もみんなと協力して新規に追加するなんて大変だな・・・」なんて素直に思ってるわけです。「今度の 0208は、文字数倍くらいになっちゃうのか・・・どうやって実装するのかな?ソフトウェアとか書き変えなくちゃいけないのかな?」なんてナイーブに思っちゃってて、会社に戻って「みんなと検討しないと、凄い大変なことになってますよ」なんてことを思ってるわけですよ。大きな勘違いなんだけど・・・。
若いって、業界のお作法を知らないから。
もう一方でISO(国際標準化機構)って組織があるんですね。その中にSC 2/WG 2っていうグループがあって、マルチバイトの文字コードを研究開発して標準を作りましょうっていうグループなんですね。それで1984年の私が新入社員の時に第1回会合が京都で開かれたと思うんです。要するに日本でJISの2バイトの文字コードが非常に成功して、それがあることによって例えばワープロみたいなものを皆が利用できるようになったので「標準化は素晴らしいな」となったんですね。メインフレームの人は建前としてだけで、そうは思ってないんですけどね。パソコンとかが出てきて皆で文字コードを交換できるようになって、パソコンでワープロみたいなのも出てきて、みんな便利になっていいねみたいなのがあったんですね。それで中国とか韓国もある程度参考にして、それぞれGBって規格作ったりKSっていう規格作ったりしたんですね。当然そうなってくると、それを国際標準にしましょうっていうある意味で言うと分かりやすい話になってくるわけですよ。それがSC 2/WG 2っていう所で開発されてました。最初は日本の規格と中国の規格と韓国の規格を1面ずつ持って行って大きなテーブルにマージしようなんていう感じでやってたんだけど、やっぱりなんやかんや言ってそれだけじゃ足りないなっていうことがだんだん分かってきたんですね。
最初は2バイトの国際標準にしようというお話だったのだけど、それじゃあ足りないから4バイトにしよう。しかしバイトというのは何ビットか不明なので、Multi-Octet(8ビット)の標準を作るということになった。
例えば大漢和字典なんていう辞典には親字だけでだいたい50,000文字くらいあるから、そうすると16bitだとベターに使っても64,000ぐらいしか入らないんですね。
大漢和でもういっぱいいっぱいだとすると、中国とか韓国とかを持ってくると16bitではちょっと厳しいかなということが研究していくうちにだんだん分かってきて、今から20年前にですね「Apple」と「Xerox」の人たちが16bitで世界中の文字を表現しようということで、 Unicodeっていう仕様を提案するわけですね。
バージョン1.0のUnicodeっていうのは、あまりにも杜撰だったんで、そのまますぐには使い物にならなくて国際標準の世界では1度は否決されたんだけど、とりあえず16bitでガッツリ行こうぜっていうコンセプトのもとでもってきたんですね。
日本のベンダーをはじめ「IBM」も「DEC」もそうなんだけど、今ある文字コードを全部チャラにして丸っきり互換性のないものを導入するにはあまりにもコストがかかるし、「それはいくらなんでも厳しいんじゃない?」みたいな感じだったんですよ。
当時ISOで議論されていたドラフト(DIS 10646という)はデフォルト2オクテットで各国のJIS/GB/KSなどの標準をそのまま94*94の面を4つ用意してそこに埋めるという案だった。1オクテットのコードとの混在は考えていない、2オクテットのみという使い方。混在したい時はエスケープシーケンスでやってね。という今から考えても実にアバウトな設計だった。94*94なのでコントロールコード(0x00〜0x1f)および空白(0x20)、削除(0x7f)などの部分が避けられていた。
一方Unicodeの方は94*94ではなく、べたに0x0000~0xffffまで使うということで、1オクテットでみると0やコントロールコードなどが入っているので、そのままではCの文字列(char *)に使えないなどという問題もあった。
だけどマルチバイトのユニバーサルな文字コードっていうのは絶対に必要だねっていうのが、ベースのベースではありましたね。でも、ベースのベースではあったんだけどJISのX 0208ですら同意しようとしていない日本のベンダーは「そんなもんは絵空事で、20世紀中に出てくるわけねぇ」みたいな感じで、言うのは簡単だけど誰も使いやしないし実装もコスト高くなるし、いったい誰がそんなもん使うんだみたいな感じでしたね。Unicodeを皆で標準化しようなんていうことに関しては、むしろ足引っ張るみたいな感じだったんですよ。本来なら尊敬すべき偉い人だと思うんですけど、会社の事情でエンドユーザに対して迷惑かけてるなと、そういうことを平気でやるんだこの人たちはと、30歳ぐらいの青臭い私は思うわけですよ。
私は思うわけだ。世界のソフトウェアが初めから世界の言葉をサポートする世界がきたら素敵だなと思うわけだ。思うのは自由だ。それを実装するのは大変だけど。
一方で、Unicode作ってる連中の最初の提案はボロボロだったんだけど、この1つのものを皆で作ればソフトウェアの作りも簡単になるし、一発ソフトウェア書けばそれが世界中の人たちに使われるんだっていう極めて分かりやすい理想を掲げてるわけですよ。
そういうのはメインフレーマーじゃなくて「アップル」とか「マイクロソフト」とか「サン・マイクロ」とかいう割と小さい会社だったりして、徐々に私はそっちの方に共感していくわけですよ。
その16bit の文字を使うためにコンパイラはどういう風に変えなくちゃいけないのかとかね、それをするために「OSはどういうような仕組みにしなくちゃいけないのか」とかっていうのを必死になって考えて、例えば「マイクロソフト」ならWindowsNTにUnicodeをはじめから採用しますとか、Cのコンパイラに Unicode用のwchar_tみたいなのを作りますとかいう色んなことをベースからどんどんどんどん作っていくんですね。
それはそのUnicodeならUnicodeっていうことで、「アップル」も「IBM」も「サン・マイクロ」も「HP」も「DEC」のエンジニアも共同で協力してなにがしかを作るという感じでしたね。
もちろん企業間競争はあるんだけど、足の引っ張り合いじゃなくて、いいものを作るっていうことに関しては腹割ってやるっていうエンジニアの非常に真面目な技術に対するロイヤリティの高さっていうのを垣間見て「おぉこいつらすごいなぁ・・・」と、こういう人たちと仕事したら気持ちいいだろうなっていう風に思いましたね。
会社や国の壁を越えてコラボレーションするのは本当に面白い。素晴らしい経験だったと思う。
そこが非常に私にとってはアイロニーの部分なんです。日本の企画(まま)委員会に入ったが故にそういうものを見て、国際標準の世界を見、180度違うパラダイムがあって、垂直統合から水平統合に世の中が変わっていく瞬間を見、「DEC」っていう会社がなくなっちゃって、90年代になって「オラクル」っていう会社に転職をしたんですね。だからある意味で言うとメインフレーム型の垂直統合の典型的な会社から、水平統合の典型的な会社へ転職したんです。その表と裏にはやっぱりJISの委員会とISOの委員会の表と裏があったんですね。ISOも本音部分ではドロドロした部分があったとしても、いかに建前を尊重して理想に近づけていくかっていうことを各社の標準化委員会に出てきている人たちエキスパートは相当真面目にやってましたね。
国際標準の世界ももちろん政治的かけひきや本音と建前はあるけど、だけど、わたしのユメであるいつの日か世界のソフトウェアが初めから世界の言葉をサポートするんだというものに、本音がどうであれ、皆共感してくれたと思う。ユメをみんなで共有していたような気がする。
日本人は英語が不得意だからとか世界標準を作るのが不得意だからと訳知り顔で言う人がいるが、そんなのは嘘である。本当に標準を作りたいのであれば英語は問題ではない。志の問題だと思う。
で、当時の日本のメインフレーマに所属していた人たちは世界標準を心の底から作ることを望んでいなかった。少なくとも作ることに本気ではなかったように思う。
非常に残念である。
もし、Unicodeをよくすることに、彼らが協力していれば、日本のソフトウェア産業もひょっとしたら輸出産業になったかもしれないが、歴史はそうはならなかった。
あすなろBLOG3周年記念イベントに行ってきた
http://www.pasonatech.co.jp/blog_event/event090418.html
なかなか面白かった。特に懇親会がまたまた熱かった。
渡辺千賀
始まりつつある未来 米国ベンチャーキャピタル投資の推移 2000年ころバブル 今は全然痛んでいない 投資もするんでいる600M シリーズAも多い インターネットの変遷 おさらい、収穫期だよというお話 おまけ、リアルなビジネス、 ファックス、テレックス(文字最小化) email(97年ころ) 社会構造の変化(インターネットありき) インターネット収穫期的なビジネス リアルビジネスの置換 OpenTable レストラン予約システム ASPモデル、予約料、40億円位の利益 Zappos 創業1999年、オンライン靴屋、売上1000億円位 顧客サービスに力を入れている。コールセンター業務 若くて経験のある創業者が増えてきた。ざくざくいる。 ネットワーク型コンシューマデバイスの普及 Eye-fi メモリチップ+サービス Chumby もらって困るプレゼント ハードウェアをベンチャーが作れる。5億円くらいでできた。PCH。中国 Flip Video デジタルビデオ。590億ぐらいCISCOが買収。 デジタルエンターテイメントの本格普及 Netflix ストップ高の株価。売上1300億くらい ビデオを郵送レンタル。Xbox経由でビデオが見られる。 最初100万人くらい利用している。15億分。毎週2時間。 会員数1000万人くらい ものすごい伸びている Hulu 人気番組が全編見られる 大人気 広告60億円位、今年120億くらい 始まりつつある未来 個人の時代 LiveOps バーチャルコールセンター業務。在宅コールセンター。 応募者の2%位しか採用しない やる気をキープするのが大変。 Voice123 在宅勤務。声優。 LinkedIn 仕事用SNS Craigslist 求人広告。3行広告。 売上100億くらい Twitter どうやってお金儲けにつなげるか iPhone Apps 個人の時代でのブログの役割 情報発信 情報収集 オンラインでのネットワーク チェンジ 3年以上先のことを心配しない 自分が正調できる場所を探すのは自分の責任 未来をビジュアライズする 広く見る 調べる ちょっと試してみる 俯瞰して逆算する 全体像を考える。取り合えずの前にちょっとは考える。 恐怖のほとんどの原因は知らないだけ サンフランシスコ近辺はさけたい。地震が怖いから。 というのは単に知らないから。東京の方が地震の可能性が高い。 Listen-IT開発中 質疑 在宅ビジネス。家が小さい。がんばってください。 製品としての付加価値はソフト。ハードは絶対残る。半導体ベンチャー難しい。 留学をする
感想:今回のイベントの目玉企画。わたしはTwitterで@chikawatanabeをフォローしていてたまたまそこで告知されていたので勢いで申し込んでしまった。やはり渡辺人気か、女性の参加者が多かったように思う。
パネル コミュニティXブログ
堀川貴満 モデレーター 上原仁 大橋悦夫 藤代裕之 上原 Blog : 近江商人JINBLOG ( http://ceonews.jp/ ) 大橋 Blog : シゴタノ! ( http://cyblog.jp/ ) 人と話すのが嫌い。コンサル。会うのが苦手。 藤代 Blog : ガ島通信 ( http://d.hatena.ne.jp/gatonews/ ) ブログを書いていてよかったことがある ブログによって今の自分がある 炎上したことがある コミュニティは運営より、参加が楽しい コミュニティ運営はしんどい 藤代:しんどいけどリターンが多い 上原:大変さより喜びっが多い 大橋:一人でいたいたち 他のコミュニティの活動が気になる 上原:気になる 藤代:参考にしたりする 大橋:家に居た方がいいので、他のコミュニティに出ない コミュニティ運営にブログが必要 上原:告知媒体。事後。つながる。 藤代:ブログが必要かどうかはコミュニティの形態による。 コミュニティを知らない人が入るきっかけ。新しい人を入れる 会社ともめたことがる 上原:前職時代会社と揉めた。 藤代:会社とブログ運営が揉める。会社=コミュニティ。家庭すら 会社に従属。そーゆー人もいるということを理解する必要がある。 上原:コミュニティの価値。大企業では多様性の担保ができている。 藤代:空想の多様性。中流的な価値観ではなく崩れていく。ブログによって 多様性が発見させる。架空の多様性を信じている。会社こそコミュニティ。 リアルな場がなければコミュニティは盛り上がらない 大橋:リアル疲れがいや。期間あけなからやる。 藤代:あった方がいいんじゃないですか。 上原:リアルが必要 コミュニティを清算したことがある 大橋:ブログ、セミナー。一個。 藤代:結構沢山ある。少なくとも5〜6個はある。 できる部分でやる。興味なければ抜ける。コミュニティは死ぬことがある。 上原:タコ壺。最初はオープンでフラット。気持ちいい。広がって広がりすぎる と規模感からあふれる。心地よくなくなる。 RTCカンファレンス。毎月やっていたのがやらなくなった。タコ壺化を感じていた。 熱量を発する。 コミュニティに経済的な目的をもったら萎えた。 なぜコミュニティを立ち上げたのか 上原:無目的。何かやりたいことがない状態。自然にできてきた。 藤代:大手町ビジネス〜(OBIA)。試して見たかった。立ち上げてみたら どうなるんだろうどんなもんだろう、と試して見たかった。 組織にいるんだけど閉塞感を持っている人たちと繋がりたかった。 狙った層が集まってきたか。外す場合もある。所属している組織では周縁 にいる人が集まる傾向がある。 大橋:会社員時代、体を壊して辞めた。コミュニティから逃げている。 コミュニティを継続するコツ 藤代:継続することが目的なのか。継続しないといけないのか。 上原:継続するコツ。タコ壺化しない努力。テーマを掘り下げるのを 逆に振る。多様性の担保。 藤代:タコ壺の居心地のよさは。 上原:そーゆーのもある。 「気持ちいい人もいれば、タコ壺化を感じる人もいる。 何も言わないで去っていく人もいる。」 パネラー同士の質問タイム。 ぐっとくるようなリターン? 藤代:やりたいことがいる仲間がいる。ブログでもリアルでも やりたいことがある。 上原:五感全体でやる。 藤代:同じ会社にいて、いきなり変な奴が来た。 上原:うわー仲間が増えたとうれしかった。 藤代さんは目的型コミュニティを作るように見える。 藤代:組織を信じていない。ジャーナリズムに進化。 パラダイムの変化があった。ジャーナリズムの価値を 高める。 継続するコミュニティではなく、結果として継続しているコミュニティ 維持していくコツ。 大橋:楽しければいい。自分が楽しくてそれに共感する人が 集まる。 上原:相互に叩き合う。 藤代:要するに寂しいのね。上原さんは。Community of Practiceを 読む。進化を前提。内部外部。価値に〜 テーマによって、コアグループ、周辺の人が移動する。 ブログとコミュニティのありかた 上原:垣根が下がったこと。コミュニティの運営が下がった。 藤代:コミュニティに参加するには個が必要。そのツール。 大橋:結果として集まる。パーソナルラーニングのツールがブログ。 続くコミュニティは? 上原:ながれている空気が性善説。 藤代:価値提供。虎屋。 大橋:ブログ4年やっている。 上原:価値の中心が横の繋がり 反発? 藤代:羨ましい、やばいということか。人間は進化したいと思っている。
感想:藤代さんのわたしは組織を信用していないという発言に共感を持った。組織を維持することが目的になってしまう場合がある。それと同様にコミュニティも維持することが目的になってしまうとタコ壺化する。維持する事を目的とするのではなく、結果としてかろやかに持続している。そのようなコミュニティ運営のコツを知りたいと思った。そのようなコツを共有したいと思った。それには、固い組織というのではない、やわらかな組織、一見ぐづぐづゆるゆるな運営と言う方が向いているような気がする。カーネル読書会が10年続いているのは、会則とか明文化したきちきちの重い制度がないからのような気がした。
4月22日訂正:藤代さんのコミュニティはOBIAではなくてOBIIです。お詫びして訂正します。http://obii.jp/
未来Xブログ
徳力:モデレータ 会場。ブログ持っている人多数 田端:不規則発言もあると思う。ライブドアでブログ事業。 リクルート、NTTデータにいた。 関:SixApart。2002年ころからブログを書いている。前は日経BPで記者。 最後に取材した会社がSixApart。 藤井:サイバーエージェント。Ameba。TMN(Telent Media Network) 芸能人ブログ。 徳力:ブログ。日記、コミュニケーションツール、メディア的という機能がある。 田端:自分の分身。 関:ソーシャルツール 藤井:ブログマネジメント ビジネスマンにとってブログを書くスキルが必要になってっくるか。 田端:ブログで褒める。使えた方が絶対有利。 関:社員のブログにコメントをつける。 徳力:実名でやるとき有利なのか。リスクはないのか? 関:ブロガー座談会。外資系は写真出して、名前も出している。 日本企業はこっそり。ルールがあって、その中でやれる。 藤井:社長が言っちゃいけないことを最初に書いちゃう。ルールを 作らないでやっている。アゲハ嬢。2chでも叩かれている。内定者。 田端:ルールをつくろうという議論があった。部下がブログが 書いていれば、なるべく読むように奨励する。 関:明示的なルールがない。書くモチベーションが重要。人として関心を 持つか。 徳力:ブログを書くのにどうすればいいか。 田端:書けばいい。 関:趣味のブログ。 徳力:こいつあかんやろ。 藤井:名前はどんどん出せばいい。名前出せばそんな変な事を書かないだろう。 ブログとマスメディアの役割分担は 藤井:マスメディアは編集が入っている。自分が伝えたいことを伝える。 直で情報を訴えられる。 田端:10年のスパンでいえばマスメディア意味ない。 関:雑誌メディア。取材のネタをブログにかけないと思った。恐る恐る書いていた。 アメリカのメディア。オールドメディアは凋落していく。読者の声を聞いていない。 コメントにバリューがある。 メディア特性の限界。文字だけではない、映像とか。 徳力:個人にとって、どのような意味があるのか。ブログという発信ツール。 メディアとしての使い方。 田端:彼氏からの携帯メールが強烈なキラーコンテンツ。コメントが価値がある。 ROMするだけじゃなくてコメントしてみるのがいい。 関:メディアは書くときに相手が見えない。雑誌のアンケート。電話番号があったので 電話して聞いてみた。コミュニケーションがはじまった。 田端:コメント欄の態度がリトマス試験紙。 藤井:芸能人上位にいる人はコメント欄開放している。 神児遊助。ポジティブ。 動画、音声、技術的なトレンド 田端:なんでも受け入れるプラットフォーム。 藤井:動画ブログはあんまりはやっていない。テキストベース。 マイクロブログは? 関:置き換えではない。ブーム。言わない時は成熟。 バッテリー切れ。約4時間利用できた。 オリジナルのテキストを書いた人が偉い。批評家。
感想
ブログをどのようなツールとみるかは人それぞれだし、いろいろな可能性がある。わたしなんかは、日記的な日々の雑記から、自分が考えたことやったことの論評的な一次情報の発信やら、ごった煮風のなんでもありのものになっている。結果として自分を表現するメディア、自己紹介的な分身になっている。実世界の自分とこの日記は鏡の関係である。
ブログには愛がある。チカラがある。そんなことを思った。