脇見運転 このページをアンテナに追加 RSSフィード

ページ下に目次を用意しています。ボストン滞在記録は2004年1月からご覧ください。スカイポッドについては専用目次をご覧ください。

2004-04-20

とにかく外国語で日記を書きたい人はこちら→id:suikan:20040420#p5

はてなで外国語

えー、「はてなダイアリーunicodeを!」と、ここのところわめき散らかしている酔漢です。

わめくだけではだめなので

を、調べようと思います。とりあえず、繁体中国語入力システムIME PADを設定して中国語を入れようと試してみましたが、id:tinuyamaさんのご指摘どおり、コメントでしかうまくいきませんでした*1。これが?Dの問題なのか、それともIEの問題なのか、他の方はどうしているのか、じっくりと調べなければなりません。それまで皆さん暖かく見守っていただければと思います。

まずは実際に外国語を入力されている方に聞き取りを行う予定です。また、提案されている数値文字参照入力法も試して見ます。

つーか、「教えてはてなダイアリーの偉い人っ!!!!!」

とりあえずビール

id:tinuyamaさんのところのコメントid:Ctransさんが紹介なさっている

10進、16進文字コードin HTMLユニコードを使うと、中国語だけでなくunicodeで表記できる文字をすべて数値文字参照に変換できます。

  • 例:你好嗎

これを使ってはてなに好きな言語で入力し、編集する易しい解説を夜に書きます。

ヨーロッパの言葉の研究(メモ書き)

ヨーロッパの言葉は英語アルファベットと文字が似ているため、十把ひとからげで「ヨーロッパ言語」として文字コーディングされる場合があります。この場合、特別なコーディング規則を使わずに1バイトで表現可能です。アイルランド語を書いていらっしゃるid:michealhさんによると、Windowsを使ってはてなに直接アイルランド語の文字を書き込むことが出来るようです(id:michealh:20040311)。さっそくWindowsXP英語アイルランドキーボードドライバを入れて実験してみました。michealhさんのページソースを見ると、きちんと数値文字参照が使われています。

  • Mozilla Firefoxでファダ付の文字を直接入力すると、1バイトの西ヨーロッパ文字として入力されます。これはEUC-jpのコーディングとしては違反ではないでしょうか。こうして入力したページはうまく表示されますが、IEで編集しようとするとぐちゃぐちゃに壊れました。おそらくFirefoxの問題です。
  • IEでファダ付の文字を直接入力すると、?Dに登録できませんでした。
  • 10進、16進文字コードin HTMLユニコードにファダ付文字を入力して数値文字参照に変換した後?Dのテキストエリアに貼り付けると、うまく表示されます。
  • ファダ付文字(アイルランド語):áíúéó

このことから、西ヨーロッパ言語のように英語に近い(と、私のような素人には見える)言語も、数値文字参照に変換して入力したほうがよいようです。

理屈はともかく多国語日記(日記を書く)*2

目次

  1. 理屈はともかく多国語日記(日記を書く) ←今日
  2. 文字化けをなくす
  3. <SPAN>と<div>の使い分け
  4. 国連憲章

はてなシステム英語日本語日記しか取り扱うことが出来ません。これはシステム上仕方のない制限です。しかし、WEBシステムの国際標準で定められている「数値文字参照」という機能を使うと、中国語、ハングルアイルランド語フィンランド語、フランス語イタリア語と主だった言語殆どで文章を書くことが出来ます。理屈はさておき、こういった言葉で日記を書きたい人のためにどうすれば日記を書くことが出来るか説明します。

さて、ここでは繁体中国語の例をとります。例は中国語ですが作業はどんな言葉でも同じです。日記の中に次のように書きたいとします。

「你好嗎」は「ご機嫌いかがですか」という意味です。

しかし、はてなダイアリーにこのとおり入力してもうまくいきません。中国語を書きたいときには次のように入力しなければなりません。

「&#x4F60;&#x597D;&#x55CE;」は「ご機嫌いかがですか」という意味です。

「你好嗎」という文字の列がまるで暗号のような文字の列になっています。これが数値文字参照と言われる記号です。さあ入力しましょう、

…ってこんなもの入力できるかぁっ!(ノ-o-)ノ~┻━┻

そこで、中国語から数値文字参照への変換ツールを使います。ツールは以下の「10進、16進文字コードin HTMLユニコード」を使います*3。作った方に感謝。

開いただけでくらくらしているそこのあなた!大丈夫、下に説明用の絵を用意しましたからこれを見ながら読んでください。

さて、絵を見ながら説明を進めましょう

  1. まず、画面の(1)の部分に中国語を書きましょう。ここでは「你好嗎」と書きます。テキストエディタ中国語を書いて、それをどんと貼り付けてもかまいません。
  2. つぎに(2)の「文字を10進、16進コードに変換する」ボタンを押します。
  3. すぐに結果が出ますので貧血で倒れる前に(3)の「コピー」ボタンを押します。これで数値文字参照をコピーできました。
  4. 最後に、はてなダイアリーの編集画面で、中国語を入れたいところに数値文字参照を貼り付けます。
  5. はてなダイアリーの「この内容を登録する」をクリックして終わり!

どうですか?そんなに難しくないですね。あん汁より芋が安し。試してみましょう。

理屈はともかく多国語日記(日記を編集する)

日記を数値文字参照で書いたはいいが、修正したい点を発見…。さあどうする!と、いうときには次の手順を踏みます。

  1. まず日記を編集画面にしてテキストエリアから修正したい部分の数値文字参照をごっそりコピーします。
  2. 次に10進、16進文字コードin HTMLユニコードを開いて、下のURLの図の(1)の部分に数値文字参照を貼り付けます。
  3. 図の(2)のボタンクリック
  4. 図の(3)のボタンクリック!…しなくていいな。ごめんなさい。

これで数値文字参照中国語に戻ります。編集した後は、こんどは先ほどの日記を書くときの手順をたどって数値文字参照に戻します。

と、まぁこんな感じです。それほど難しくないです。

多国語処理に関するコメント

台湾の方が日本語で動作しているWEBシステムへの書き込みに関して興味深い言及をされています。

しかし、IE4・NN4からは多国語を対応しました。投稿のときもページのコードをチェックして、正確のコードでデータを送ります。該当のコードにない文字があれば、自動的に数値参照に転換するのは普通です。
つまりIEは自動に外字を数値参照に転換してくれますから、普通の場合ははてなのようにはじかれることが殆どありません。はてなだけトラブルがあるそうです。 but@台湾 ののたん観察日記「はてなの中国語投稿問題」

面白い。経験に基づく意見だけに重みがあります。自分が持っている別サイトBBSで実験をして見ました。確かにIEはShift-JISにない漢字を数値文字参照に変換して書き込みます。ところで、実験によるとWEBページがEUC-jpであっても正しく数値文字参照に変換していました。つまりIEは無実です*4

はてなには何かがあるように思えるのですが、一方で「EUC-jpやshift-jisの時だけ数値文字参照に変換する」というのはIE固有の機能ですので、これに頼りすぎるのも危険かなと思います。この点、判断がつきません。

.ukアンテナ

id:romeonjulietさんがukアンテナを立てていらっしゃるのを発見。早速取り込ませていただきましたm(_._)m

繁体中国語表示実験

id:QianChongさんのところより一文拝借

已成為一種“傳說”。

已成為一種“傳說”。

lang属性はてなにより剥ぎ取られる模様。WinXP+Mozilla Firefox 0.8では正しく表示されますが、WinXP+IE6.0では「説」が●になります。追記:はてなはlang属性を剥ぎ取らなくなりました。

*1:あんまり何度も試しましたので、ニイハオマ?を漢字で書けるようになりました

*2WindowsXPでしか試していません。Windows2000でも出来るはず。Windows98/Meの人はIEの多国語サポートをインストールしてください。

*3:残念ながら、私のMozilla Firefox 0.8では使いませんでした。MS Internet Explorer 6.0では使えます

*4Mozilla Firefoxは無理やりUnicodeで書き込みます

QianChongQianChong 2004/04/20 22:39 id:Ctransさんからご教示頂いた方法で書き込んでみました。なんとかできました。

suikansuikan 2004/04/20 22:43 ちょうど私も出来たところです。これをやってくれるだけでも随分違いますね。

yukattiyukatti 2004/04/20 23:05 はてなダイアリーでのハングル複Lについては、キーワード「ハングル」http://d.hatena.ne.jp/keyword/%a5%cf%a5%f3%a5%b0%a5%eb?kid=6553#p1に方法が載せられていてますが、はてなダイアリーTipsからも紹介(誘導リンク)しています。ぜひ、「これを使ってはてなに好きな言語で入力し、編集する易しい解説」もTipsにて紹介させていただきたいのですが、よろしいでしょうか。

yukattiyukatti 2004/04/20 23:05 文字化けすみません。「ハングル入力」です。

suikansuikan 2004/04/20 23:18 こんにちは。とりあえず今晩簡単な説明を書きますので、それをTipsで紹介していただいてかまいません。ただ、非漢字入力はもっと簡単にやってるんじゃないかと睨んでいるのでそちらの調査結果も後日紹介する予定です。

yukattiyukatti 2004/04/21 08:23 ありがとうございます。記事のひととおりの完成ののちTipsで紹介させていただこうと思います。/中国語入力について、http://d.hatena.ne.jp/matsunaga/20040113#p2に要望記事がありました。ちょっとしたTipsとして、Googleで検索するという方法も紹介されています。

suikansuikan 2004/04/21 08:28 一通り書き終わりました。さ、次はhatenaへの要望まとめるか。

QianChongQianChong 2004/04/21 08:51 お疲れ様でした。非常にわかりやすい説明だと思います。今、変換ツールのサイトで変換ボタンを押してもなぜか何の反応もない、という状況に直面しました。なぜだろう? もう少し原因を考えてみます。

suikansuikan 2004/04/21 09:04 不思議ですね。今確認しましたが動きました。説明に間違いがあるのかな。

QianChongQianChong 2004/04/21 09:37 問題があるのは昨日使ったのは別のパソコンです。たぶん機器の設定の問題か何かだと思うのですが。引き続き考えてみます。

yori_nonsanyori_nonsan 2004/04/21 12:17 suikanさん ありがとうございます!さっそく書いてみました。やったー!できたー!世の中にはとーっても便利なものがあるんですね!

suikansuikan 2004/04/21 12:22 やったー!おめでとうございます!変換ソフト作られた方にほんとに感謝です!

2001 | 01 |
2003 | 10 | 11 | 12 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2013 | 01 | 03 | 04 | 05 | 06 | 07 | 09 | 10 | 11 | 12 |
2014 | 02 | 03 | 04 | 07 | 08 | 09 | 10 | 11 | 12 |
2015 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 12 |
2016 | 01 | 02 | 03 | 04 | 07 | 09 | 10 | 11 | 12 |
2017 | 01 | 02 | 04 |