このところ,久しぶりに裁断・スキャンをしている。昨年の11月以来だろうか。
もっと良いやり方もあるのだろうが,いろいろな経験と実験の結果,白黒画像の書籍(数学の本は大体これだ)については,ほぼ固まってきた。
今日は,ヴィノグラードフ「整数論入門」(共立全書)の裁断・スキャンのメモ。

共立全書はハードカバー(ハードバウンド)なのに普通のハードカバーと違って,背表紙に直接接着剤でくっついているので,いささか面倒。完全に解体するのなら,カッターでガシガシ切れば良いのだが,カバーの外観を残しつつ解体しようとすると,デリケートな作業を強いられる。

ヴィノグラードル「整数論入門」(共立全書)の裁断1

ヴィノグラードル「整数論入門」(共立全書)の裁断2

ヴィノグラードル「整数論入門」(共立全書)の裁断3

ヴィノグラードル「整数論入門」(共立全書)の裁断4

ヴィノグラードル「整数論入門」(共立全書)の裁断5

裁断が済めば,あとは簡単。少し時間はかかるけれど,600dpiのJPEG画像で読み込むことにしている。ホントは圧縮なしのBMPとか可逆圧縮のPNGが良いのだが,ScanSnapではそれが出来ないので,やむを得ずJPEGで。それを自作のプログラム(OpenCVとImageMagickを利用したC++プログラム)でモノクロに変換する。パラメーターは本の状態で変えるのだが,赤チャンネルのみ抽出してグレースケールにしたあと,High=245, Low=20, Gamma=0.8くらいで変換しThreshold=200あるいはOotsuの手法(自動)にて2値モノクロにし,画像深度1bitでCCITT Fax Group4の圧縮にてTIFF画像として保存。場合によっては,最初に2倍にオーバーサンプリングして1200dpiにする。今回はそれは止めて,600dpiのままでモノクロにした。

600dpiのモノクロTIFF画像をPDFにまとめて,別途スキャン&加工しておいた表紙をつけて,とりあえずは出来上がり。今回はさらにAcrobatのOptimize Scanned PDFを行って,傾き補正をしつつOCRをし,圧縮をCCITT Group4からJBIG2(Lossless)に変更して軽量化した。

投稿者 sukarabe

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です