2007-09-26
■[command]nkfを使って、ディレクトリ以下のファイルを「EUC-JP」⇒「UTF-8」に一括変換する。
いろいろ方法はありそうですが。。。
はじめに、教えてもらって、良いなと思ったのはこちら。
$ find . -type f -name "*.php" -exec nkf -w --overwrite {} ;
findでディレクトリ以下のphpファイルを見つけて、execでnkfしています。
なるほど、と思ったのですが、UTF-8 への移行計画 - いやなブログさんより、
さらにいいコマンドが紹介されてました。
最初の実行で、変換結果が正しく UTF-8 になるか確認しているようです。
(もし文字化けが起きた場合は BINARY という表示になるみたい)
**/*.php.nc は、再帰的に *.php.inc というファイルを探すという、 zsh の便利な記法です。
こちらだと、一度変換結果も確認できるし、良さそう。
メモメモ。
| オプション | 備考 |
|---|---|
| b | バッファリング出力を行う |
| -u | 出力時にバッファリングを行わない |
| -j | JISコードに変換する |
| -e | EUCコードに変換する |
| -s | シフトJISコードに変換する |
| -w | UTF8コードに変換する |
| -i? | JIS漢字を指示するシーケンスとして ESC-'$'-?を使用する |
| -o? | 1バイト英数文字セットを指示するシーケンスとしてESC-'('-?を使用する |
| -r | ROT13/47の変換する |
| -T | テキスト・モードで出力する |
| -l | 0x80-0xfeのコードをISO-8859-1 (Latin-1)として扱う。ただし,JISコードの時のみ有効 |
| -f? | 一行?文字になるように簡単な整形を行う |
| -Z | X0208中の英数字と一部の記号をASCIIに変換する |
| -J | JIS(ISO-2022-JP)と仮定して処理する |
| -E | 日本語EUCと仮定して処理する |
| -S | シフトJISと仮定して処理する |
| -X | シフトJISと仮定して処理する。ただし,X0201仮名があるものとする |
| -B | 壊れた(ESCが欠損した)JISと仮定して処理する。-B1の場合はESC-(およびESC-$)のあとのコードを問わない。-B2の場合は改行の後に強制的にASCIIに戻す |
| -x | 通常行われるX0201仮名->X0208の仮名変換しない |
| file | 変換元のファイルを指定する |
トラックバック - http://d.hatena.ne.jp/kasahi/20070926/1190833699
リンク元
- 6 http://www.org44.com/blog/2007/0822_1129_index.php
- 4 http://bookmarks.yahoo.co.jp/my
- 4 http://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&rls=GGLG,GGLG:2006-20,GGLG:ja&q=linux ファイル 文字コード 変換 convmv
- 3 http://www.google.co.jp/search?hl=ja&client=firefox-a&rls=org.mozilla:ja:official&hs=AL3&q=flash+debug+plugin&btnG=検索&lr=
- 3 http://www.google.co.jp/search?hl=ja&q=trac+シンタックスハイライト&btnG=検索&lr=lang_ja
- 3 http://www.google.co.jp/search?num=100&hl=ja&q=Auth+pear&lr=
- 2 http://b.hatena.ne.jp/entry/4980411
- 2 http://www.google.co.jp/search?hl=ja&client=firefox&rls=org.mozilla:ja:official&hs=5o7&q=osaka+font&btnG=検索&lr=lang_ja
- 2 http://www.google.co.jp/search?q=漢字説明ジェネレーター&hl=ja&rls=GGLJ,GGLJ:2006-47,GGLJ:ja&start=10&sa=N
- 2 http://www.google.com/reader/view/


