« MacOSXでネットワークプログラムを書くなら。 | ホーム | Jリーグ秋春制構想はうんこである »
2008年11月20日
BOM付きUTF-8テキストからBOMをとる
手元のテキストファイルでUTF-8のがあって、適当なスクリプトやアプリケーションに渡してテキスト処理を行っていたのがどうもうまくいかないことがあったので、よく見てみたら先頭にBOMがついていたときの話。
nkfのマニュアルを見たところ、-wと-w8とでBOMの有無を区別してくれるので、こいつに通せばよしなに変換してくれるかと思ったけども、どうやら入力ではBOMを判別してはくれないらしい。変化はなかった。ちなみにバージョンは2.0.7。
ここで変換によるBOM取りをあきらめてエディタで削除する方針に変更。何もしないとvimはBOM付きでもちゃんと認識して表示を隠してくれるので、隠さず見せるようにバイナリモードで読む必要があり。
$ vim -b hogehoge.txt
これでok。
<feff>hogeこのようにして見せてくれるので、<feff>を消せばよい。
トラックバック(0)
トラックバックURL: http://foursics.jp/cgi-bin/mt/mt-tb.cgi/224
ありがとうございました!
参考になりました!