11月 18, 2009

TeX文書の文字コードを一括してUTF8に変換する(2)

前に書いた

Sukarabe’s Easy Living » TeX文書の文字コードを一括してUTF8に変換する

の改良版。このまま実行したら、まず、ファイルの数が多すぎると文句言われた。そこで、xargs が一度に処理するファイルの数を制限することにした。例えば -n 10 とすれば、一度に10個ずつになる。ところが今度はいくつかのファイルが見つからないというエラーに遭遇。日本語ファイル名の場合、上手く行かないケースがあるようだが、検索するファイル名をSingle quotationではなくDouble quotationで括ることで解決。さらに、空白をファイル名の区切りとしないように設定。僕自身は空白を含むファイル名を使うことはないが、念のため。空白の代わりにヌル文字を区切りと使う。そのために、find に対して、-print0 というオプションで、ファイル名の最後にヌル文字を加える。そして、xargs のオプションとして -0 とすることで、ヌル文字を区切りと解釈する。

最終的には次のようになった。これは、カレント以下の hogehoge.tex たちを一括して UTF8 (BOMなし) に変換するもの。

find . -name "*.tex" -type f -print0 | xargs -n 10 -0 nkf -w -Lu --overwrite

これで、文字コードの変換に関しては一件落着かな。

やれやれ、仕分けも財務省のマニュアル通りとは

人民裁判とも揶揄されている事業仕分けだが、結局財務省の思惑通りではないかと思っていたところ、こんなものが明らかとなった。

時事ドットコム:事業仕分けで極秘マニュアル=財務省の視点を指南−政治主導に逆行・行政刷新会議

まあ、仕分け人は財務省の台本通りに演技する役者さんだったということですか。ここまで露骨だと、唖然とするしかないですなあ。たしかにスパコンだって聖域ではないだろうし、議論の余地はあると思うが、財務省主導がこうも明らかとなると、むちゃくちゃではないか。そうそう、聖域と言えば、離れでスキヤキと言われていた「特別会計」は一体どうしたのだ。スパコン止める前に、特別会計を廃止する方が先決ではないのか。