macroscope

( はてなダイアリーから移動しました)

日本語140字は英語140字の約2倍

Twitterの字数制限は140字だが、英語のアルファベットも日本語の文字も1文字と数えられることを最近知った。

日本語140字ならば英語140字のだいたい2倍の情報を書ける。

きちんと数えなおすゆとりがないのだが、英語の文書を日本語に訳したとき、バイト数で約2割ほど減った。ただし、英語はASCIIで1文字1バイト、日本語はEUCで1文字2バイトだがその中に混ざるアルファベットや数字などはASCIIにしたので1バイトだった。ASCIIの混ざりぐあいを目分量で見積もると、日本語の文字数はちょうど英語の半分程度になる。

日本語圏で「ついったー」がはやるのももっともだ。

中国(人民共和国)ではTwitter社が営業していないがWeiboがある。Weiboの語源はmicro-blogだと聞いた。これの字数制限はどうなっているだろう?

民共和国以外の漢語圏では漢字でTwitterを使っている人もいるだろう。字数制限が同じならば、日本語よりもう少し多くの情報を書けるだろう。古典漢文ならばさらに詰めこめると思うが、古典漢文でつぶやく人がいるだろうか?

【[2018-07-31 補足] その後、Twitterではルールが変わり、日本語や中国語などの漢字をつかう言語での字数制限はそのままだが、英語などのアルファベットならば2倍の字数を書けるようになった。】