[ 備忘録 ] 書籍をスキャンしたPDFの画像補正のためのメモ。
PDFといっても書籍をスキャンしてできるファイルの場合、中身は画像ファイルであり、PDFは単なるコンテナーでしかない。それを取り出すのが目的。MacのPreviewなどから取り出すことも可能だが、できれば劣化させないで、そのままを取り出したい。あれこれ調べた結果、pdfimages で出来るようだ。それには xpdf というパッケージ(?)をインストールしなくてはならい。
以下は、Mac OS X の MacPorts でインストールする場合の手順。
sudo port install xpdf
とすればオッケー。hoge.pdf からJPGファイル群を取り出すには、
pdfimages -j hoge.pdf foo
とかすれば、foo-000.jpg, foo-001.jpg, 等々と連番でファイルが生成される。