11月 212011
 
シェアする

この間紹介した「kcc」コマンドと同じように漢字文字コードを変換するコマンド。
こちらのコマンドの方が、utf-8環境で動かすLinuxサーバーの場合は重宝すると思われる。ちなみに「nkf」は「Network Kanji Filter」の頭文字である。

以下、日本語のmanページより一部を抜粋

NAME
nkf – ネットワーク用漢字コード変換フィルタ v2.0.7

SYNOPSIS
nkf B<[-butjnesliohrTVvwWJESZxXFfmMBOcdILg]> B<[>I<file …>B<]>

DESCRIPTION
nkf はネットワークでメールやニュースの読み書きをするために作られた、漢字コードの変換フィルタである。

このnkfの特徴としては、入力漢字コード系の統計的な自動認識機能がある。このため、利用者は、入力漢字コード系が何であるかを知らなくても、出力漢字コード系のみ指定すれば良いことになる。ただ、この判定機構は、理論的には完全ではないが、通常のニュースやメールのメッセージについては確実に動作する安全なものにはなっている。

現在、nkfが認識できる入力の漢字コード系は、いわゆる JIS コード(ISO-2022-JP に基づくもの)、Shift_JIS (MS 漢字コード)、日本語 EUC (AT&Tコード)、UTF-8、UTF-16 のいずれかである。出力する漢字コード系も、これらである。入力は、ファイルを指定しなければ、標準入力となる。出力は標準出力である。

kccコマンドはUTF-8の文字コードに対応していない点、nkfはUTF-8に対応しているのでこっちが好き。
詳しくは「man nkf」でご覧ください。

以上

このエントリーをはてなブックマークに追加

コメント大歓迎!質問も受け付けておりますヽ(*´∀`)ノ