「コードポイント」は何ビットか
Unicode だと 21bit なんですが。
まぁ、Ruby にもGB18030が 32bit フルに使うので、signed int だと涙目って話はありまして。というか、あったが、codepoint codepoint 連呼する人々がいるんで怖くなり、あわてて unsigned int に直したので、関係する方々はご注意を、っていう話。エラー値が負だとか思っていると泣きを見ます。
Ruby/Iconv と Citrus iconv
「Citrus iconv API使ってない」わけでもなくて、Iconv.list あたりで微妙に使ってます。
Ruby transcode と Citrus iconv
そーいえば、Ruby 1.9 の日本語系 encoding の変換テーブルは Citrus のものを使うようになりました。enc/trans を覗くと CP とか JIS ってディレクトリが。現状ロジックはほとんど使ってませんが、ある程度は取り込まれていくことでしょう。