[ 備忘録 ] 書籍をスキャンしたPDFの画像補正のためのメモ。

PDFといっても書籍をスキャンしてできるファイルの場合、中身は画像ファイルであり、PDFは単なるコンテナーでしかない。それを取り出すのが目的。MacのPreviewなどから取り出すことも可能だが、できれば劣化させないで、そのままを取り出したい。あれこれ調べた結果、pdfimages で出来るようだ。それには xpdf というパッケージ(?)をインストールしなくてはならい。

以下は、Mac OS X の MacPorts でインストールする場合の手順。

sudo port install xpdf

とすればオッケー。hoge.pdf からJPGファイル群を取り出すには、

pdfimages -j hoge.pdf foo

とかすれば、foo-000.jpg, foo-001.jpg, 等々と連番でファイルが生成される。

投稿者 sukarabe

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です