2014-10-28 (Tue)
MySQL 5.5以降のutf8mb4とPerlのDBD::mysqlのmysql_enable_utf8のワナ
結論から言うと、ひろせが望ましいと思う順にこうすればいいんじゃないの?ってのを列挙します。
- my.cnfに[libmysqlclient]グループを追加しそこにdefault-character-set = utf8mb4と書き、DBD::mysqlでは mysql_read_default_file=/etc/my.cnf;mysql_read_default_group=libmysqlclient と指定する
- mysql_enable_utf8を使いたい場合はSET NAMES指定も必要
- my.cnfの[client]グループにdefault-character-set = utf8mb4と書き、DBD::mysqlでは mysql_read_default_file=/etc/my.cnf と指定する。mysqlbinlogなど--default-character-setオプションを解せずエラーになるものは--no-defaultsをつけて実行する
- mysql_enable_utf8を使いたい場合はSET NAMES指定も必要
- DBD::mysqlで接続後に SET NAMES utf8mb4 を実行する
オハマリポイントは
- DBD::mysql (libmysqlclientなクライアント全般?) は loose-default-character-set の設定値を認識しない
- select結果をPerlの内部表現文字列(UTF8フラグ)にしようと DBD::mysql の mysql_enable_utf8 を使うと、ついでにクライアント側も文字コード設定を(utf8mb4ではなく)utf8にしてしまう
です。
DBD::mysql (libmysqlclientなクライアント全般?) は loose-default-character-set の設定値を認識しない
my.cnfの[client]グループに書いた設定はクライアント全般に適用されるので、ここにdefault-character-set = utf8mb4 と書ければいいのですが、[client]グループに書くとmysqlbinlogなどこのオプションに対応していないクライアントがエラー終了してしまいます。
my.cnfの設定項目には loose- というprefixをつけることができて、対応していないクライアントはそれを無視することができます。
なので、[client]グループに loose-default-character-set = utf8mb4 と書いておけば、シアワセになれると思っていたのですが、loose- だとDBD::mysql (libmysqlcientを使うクライアント全般かもしれません)が認識しくれず、libmysqlclientのデフォルト文字コード(特に変えてなければ latin1)になってしまいます(ガーン)。
仕方ないので、[libmysqlclient]といったグループを新規で追加してそこにdefault-character-setを書き、DBD::mysqlにはそのグループを読むように指示するか、mysqlbinlogがエラーになるのは --no-defaults オプションをつけて回避するか、の2択になります。
SET NAMESよりdefault-character-setを推す理由は、エスケープ処理に関連するからです。詳しくはこのへんを参照してください。
select結果をPerlの内部表現文字列(UTF8フラグ)にしようと DBD::mysql の mysql_enable_utf8 を使うと、ついでにクライアント側も文字コード設定を(utf8mb4ではなく)utf8にしてしまう
の通りですが、DBD::mysqlの mysql_enable_utf8 はPerlの文字列の内部表現化(sv_utf8_decode)するだけでなく、mysql_options(MYSQL_SET_CHARSET_NAME) も実行します。
- mysql_enable_utf8 が 1
- mysql_options: MYSQL_SET_CHARSET_NAME=utf8
- mysql_enable_utf8 が 0
- mysql_options: MYSQL_SET_CHARSET_NAME=latin1
- mysql_enable_utf8を指定しない
- mysql_options(MYSQL_SET_CHARSET_NAME) は呼ばない
なにが問題になるかというと、mysql_enable_utf8 を 1 にしてネコ (Unicode: U+1F639, UTF-8: \xF0\x9F\x98\xB9) をutf8mb4なテーブルにinsertしても、utf8mb4でなく MYSQL_SET_CHARSET_NAME=utf8 になっているので DBD::mysql::st execute failed: Incorrect string value というエラーでinsertできません。
また、mysql_enable_utf8 を 0 にした場合(MYSQL_SET_CHARSET_NAME=latin1 を実行している)やmysql_enable_utf8を指定しなかった場合(libmysqlclientのデフォルトであるlatin1が使われる)、my.cnfの適切なグループにdefault-character-set = utf8mb4と書いてあれば、character_set_clientや_connectionはutf8mb4になりますが、libmysqlclientのエスケープ処理は(多分)latin1で行われるのでもしかしたら問題があるかもしれません。
(エスケープ処理が本当にlatin1で行われるのかと、その場合具体的にどういう問題があるのか、はちょっと調べきれてないので情報あったら教えてください><)
エスケープの問題を別にすれば、mysql_enable_utf8を有効にしてもしなくてもいずれにせよ、MySQLに接続した直後にSET NAMES utf8mb4を実行すれば、ネコもちゃんとハンドリングできます。
生のDBD::mysqlなら、Callbacksのconnectedでやるといいと思います。
my $dbh = DBI->connect($dsn, $user, $password, { ... Callbacks => { connected => sub { $_[0]->do('SET NAMES utf8mb4'); return; }, }, });
メモ
2014-10-22 (Wed)
bashでsplitを書いてみた
空白絡むとどうにも配列で返せなかったんで、裏変数(_split)経由で結果渡すようにしてるのがイマイチ。。。
#!/bin/bash set -u set -e export LANG="C" split() { sep=$1 str=$2 _split=() if [[ $str =~ $sep ]]; then while IFS= read -r e; do _split+=("$e") done < <(echo "${str//$sep/$'\n'}") fi # declare -p _split >&2 } split ':' 'foo:bar:baz' declare -p _split echo ">${_split[0]}<" split ':' 'f o o:b a r:baz' declare -p _split echo ">${_split[0]}<" split ':' ':' declare -p _split echo ">${_split[0]}<" exit
結果:
declare -a _split='([0]="foo" [1]="bar" [2]="baz")' >foo< declare -a _split='([0]="f o o" [1]="b a r" [2]="baz")' >f o o< declare -a _split='([0]="" [1]="")' ><
別解
PerlのDBD::mysqlをlibmysqlclient.aとstatic linkしたい話
static linkするにあたっての動機、諸注意(ハメがあるので必読)は @sonots さんの
を参照してください。
ここではDBD::mysqlをビルドする際のオプションのみ記します。
http://dev.mysql.com/downloads/mysql/ からダウンロードできるrpm
- MySQL-client-5.6.21-1.el6.x86_64.rpm
- MySQL-devel-5.6.21-1.el6.x86_64.rpm
- MySQL-shared-5.6.21-1.el6.x86_64.rpm
の場合、
$ ldconfig -p | grep libmysqlclient libmysqlclient.so.18 (libc6,x86-64) => /usr/lib64/libmysqlclient.so.18 libmysqlclient.so (libc6,x86-64) => /usr/lib64/libmysqlclient.so $ rpm -ql MySQL-devel | grep libmysqlclient.a /usr/lib64/mysql/libmysqlclient.a $ mysql_config --libs -L/usr/lib64 -lmysqlclient -lpthread -lm -lrt -ldl
こういう感じの構成になっているので、
- /usr/lib64の代わりにlibmysqlclient.aがある/usr/lib64/mysqlにライブラリパスを通す
- libstdc++もリンクする
するように、このように
$ mysql_config --libs | sed -e 's@-L/usr/lib64@-L/usr/lib64/mysql@' -e 's@$@ -lstdc++@' -L/usr/lib64/mysql -lmysqlclient -lpthread -lm -lrt -ldl -lstdc++
します。
ソースを展開してMakefile.PLを使ってビルドする場合は、--libsにこれを指定すればよいです。
$ perl Makefile.PL --libs="$(mysql_config --libs | sed -e 's@-L/usr/lib64@-L/usr/lib64/mysql@' -e 's@$@ -lstdc++@')" $ make $ ldd blib/arch/auto/DBD/mysql/mysql.so linux-vdso.so.1 => (0x00007fff9a52a000) libpthread.so.0 => /lib64/libpthread.so.0 (0x00007f3434572000) libm.so.6 => /lib64/libm.so.6 (0x00007f34342ee000) librt.so.1 => /lib64/librt.so.1 (0x00007f34340e5000) libdl.so.2 => /lib64/libdl.so.2 (0x00007f3433ee1000) libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00007f3433ccb000) libc.so.6 => /lib64/libc.so.6 (0x00007f3433936000) /lib64/ld-linux-x86-64.so.2 (0x00007f3434d84000) # ↑libmysqlclient.so を dynamic linkしていない $ perl -Iblib/lib -Iblib/arch -MDBD::mysql -e 1 # ↑ちゃんとモジュールをロードできる $ sudo make install
ちなみに -lstdc++ していない場合はこのようにモジュールのロードで失敗します。
$ perl -Iblib/lib -Iblib/arch -MDBD::mysql -e 1 Can't load 'blib/arch/auto/DBD/mysql/mysql.so' for module DBD::mysql: blib/arch/auto/DBD/mysql/mysql.so: undefined symbol: __cxa_pure_virtual at /usr/lib64/perl5/DynaLoader.pm line 200. at - line 0 Compilation failed in require. BEGIN failed--compilation aborted.
cpanmでインストールする場合は、--configure-args="--libs=..." に指定すればよいです。
$ mylib=$(mysql_config --libs | sed -e 's@-L/usr/lib64@-L/usr/lib64/mysql@' -e 's@$@ -lstdc++@') $ cpanm -n DBD::mysql --configure-args="--libs='${mylib}'"
Oracle謹製のrpmには先程書いた http://dev.mysql.com/downloads/mysql/ で配布しているものの他に、yumレポジトリで配布しているものもあります。
- http://dev.mysql.com/downloads/repo/yum/
- http://repo.mysql.com/yum/
- http://repo.mysql.com/yum/mysql-5.6-community/el/6/x86_64/
- mysql-community-client-5.6.21-2.el6.x86_64.rpm
- mysql-community-common-5.6.21-2.el6.x86_64.rpm
- mysql-community-devel-5.6.21-2.el6.x86_64.rpm
- mysql-community-libs-5.6.21-2.el6.x86_64.rpm
なぜか両者ではライブラリファイルの配置が異なっているので気をつけてください。
このように、
$ ldconfig -p | grep libmysqlclient libmysqlclient.so.18 (libc6,x86-64) => /usr/lib64/mysql/libmysqlclient.so.18 libmysqlclient.so (libc6,x86-64) => /usr/lib64/mysql/libmysqlclient.so $ rpm -ql mysql-community-devel | grep libmysqlclient.a /usr/lib64/mysql/libmysqlclient.a $ mysql_config --libs -L/usr/lib64/mysql -lmysqlclient -lpthread -lm -lrt -ldl
yumで配布しているrpmのはlibmysqlclient.soも.aも同じディレクトリ/usr/lib64/mysqlにあります。
このままではstatic linkできないので、*.aを別のディレクトリにコピーして、そこにライブラリパスを通してビルドしないといけません。
$ mkdir /tmp/oreno-lib $ cp /usr/lib64/mysql/*.a /tmp/oreno-lib/ $ mysql_config --libs -L/usr/lib64/mysql -lmysqlclient -lpthread -lm -lrt -ldl $ mylib="-L/tmp/oreno-lib -lmysqlclient -lpthread -lm -lrt -ldl -lstdc++" $ perl Makefile.PL --libs="${mylib}" OR $ cpanm -n DBD::mysql --configure-args="--libs='${mylib}'"
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 05 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 12 |
2012 | 01 | 02 | 03 | 06 | 08 | 10 | 11 | 12 |
2013 | 01 | 02 | 03 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2014 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 10 |
2015 | 01 | 02 | 07 | 10 |
2016 | 01 | 05 | 10 | 12 |
2017 | 07 |