ドキュメントスキャナーの設定(ADS-2000)
BROTHER ドキュメントスキャナー ADS-2000を購入して使っています。
利用の目的は、本の自炊。
もっと詳しく書けば、一度読んだ本を資料として残していますが、段ボールで数箱分になってスペースがもったいないですし、あとで必要になったとき、取り出すのにものすごい手間がかかるために電子書籍化しようかなと思ってのことでした。電子書籍にしてしまえば、スペースも必要ないですし、検索すれば必要な本が見つかりますし。
BROTHER ドキュメントスキャナー ADS-2000
というわけで、ドキュメントスキャナーですが、設定はつぎのようにしました。
・文字だけの本、図解や挿絵などがあっても文字が主体の本:モノクロ600dpi(OCR処理あり)
出来上がりを、たとえるなら、コピー機でコピーした感じでしょうか。だから、写真は少々見にくくなりますが、それは仕方がないのかな、と。
あと、後々、検索で書籍を見つけられるように、OCR処理しました(PDFはふつうテキストを抜き出せないのですが、OCR処理することで、テキストを抜き出せるようになります。すなわち、OCR処理することで、検索できるようになります)。
・カラーの本:カラー300dpi(OCR処理なし)
カラーの本はOCR処理すると、かなり時間がかかってしまうので、OCR処理しませんでした。あと、カラーの本自体すくないですし、カラーの本はあとで検索するようなタイプの本でもないですし。
※ADS-2000だけかどうかわかりませんが、設定画面では「300dpi×300dpi」などと表記されています。この意味がわからなかったのですが、検索したところ、どうやら縦方向と横方向の解像度のようで。だから「300dpi×300dpi」は、「300dpi」とまとめて表記されることがあるようです。
問題は二色の本です。
ドキュメントスキャナーの性能か、もともと無理なのかわかりませんが、モノクロに設定すると、本の赤字が発色されないのですよね……。
だから、つぎのようにせざるを得ませんでした。
・二色:カラー400dpi(OCR処理あり)
この設定の何が難儀なのかというと、処理速度です。
どういうことでしょうか。
スポンサード リンク
問題はOCR処理
後々、検索することを考えて、スキャンの際、OCR処理もしていました(ADS-2000の場合、設定で「サーチブルPDF」を選択するとOCRの設定になります。PDFにテキストの情報が付加されるようなので、OCR処理すると、PDFからテキストとして抽出できますし、後で検索することもできるようになります)。
このOCR処理が問題でした。
OCRの処理はパソコンのスペックで処理速度が左右されて、わたしのパソコン(5万円ほどのモバイルパソコン)では、モノクロで処理した場合でも1冊あたり30分ほどかかってしまうのです。
これがカラーになると、下手をすれば2時間ほどかかることも……。しかも、処理の途中で強制終了してしまい、やり直す羽目になることもありましたし。
執筆しながらスキャンしていたので、まだよかったのですが、このOCR処理が律速なのは言うまでもありませんでした。
それでも、なんとか頑張って20冊ほど処理できたのですが、またまた問題が発生しました。
それ以外にも、いくつか問題が発生
つぎの問題が発生しました。
・sonyの電子ブックリーダーのPRS-T3Sでは読めない
スマホでは問題なく読めるのですが、電子ブックリーダーのPRS-T3Sでは、OCR処理したPDFは白紙になって読むことができませんでした。
・ファイルサイズが大きい
後々後悔したくないので、解像度を高めに設定しています。それに加えて二色刷りの本だと、カラーなので1冊で200MB近くまで容量が膨れ上がってしまいました。
これには困りました。
そこで、この2つの件を解決するために、いろいろと調べて、無事、解決できたのですが、それは、別のページに書いています。