Hatena::ブログ(Diary)

itouhiroメモ

2008-12-24 [スキャナ][整理] 本をキレイにデジタル取り込みする方法(1)

f:id:itouhiro:20080902165717g:image 本がたくさんあると、部屋が狭くなる。

しかし、本を箱詰めして しまいこむと、取り出すのが大変だ。

なので、本は画像データ化してパソコンに取り込んで、パソコンで読むことにする。これなら場所もとらないし、パソコンあれば読める。


f:id:itouhiro:20080902165937g:image はい。


f:id:itouhiro:20080902172316g:image 今はドキュメントスキャナーというものがあるんだ。

複数の紙を自動的に一枚一枚読み込んで、パソコンに取り込んでくれるぞ。

たとえばこんなのがある。


FUJITSU ScanSnap S1500 FI-S1500

FUJITSU ScanSnap S1500 FI-S1500

  • 出版社/メーカー: 富士通
  • 発売日: 2009-02-07
  • メディア: Personal Computers

これを使ってパソコンに取り込もう。


f:id:itouhiro:20080902172315g:image ふむふむ。


f:id:itouhiro:20080902173503g:image それでは手順を示すぞ。

* 本を裁断する

* ドキュメントスキャナーでスキャンする (JPG取り込み)

* フォトショップで画像補正して、読みやすくする


f:id:itouhiro:20080902172315g:image JPG取り込み? PDF取り込みのほうが便利では? PDFだと1冊が1ファイルにまとまるし。それにPDFだと「透明テキスト」を埋め込んで、テキストとしてコピーできるし、検索もできるんだよ。


f:id:itouhiro:20080902173503g:image いったんJPGにしてしまっても、画像を補正して読みやすくしてページ抜けもなくして、その後で「透明テキスト」つきのPDFを作ることができるんだ。

まあ個人的には検索はしないし、JPGのほうが便利だと思うけどな……。


f:id:itouhiro:20080902172315g:image へー。


裁断

f:id:itouhiro:20080902173503g:image まずは、本を裁断して、1ページごとに1枚の紙に分解するぞ。


裁断機にはPLUS PK-513 というのを使っている。

PLUS 断裁機 裁断幅A4 PK-513 26-128

PLUS 断裁機 裁断幅A4 PK-513 26-128

  • 出版社/メーカー: プラス
  • メディア: オフィス用品


f:id:itouhiro:20081224181300j:image


緑のマルつけたところからカッターが見えるんだ。取っ手を引き下ろして裁断する。

f:id:itouhiro:20081224181258j:image


本が厚くてここを通らないときは、まず本をカッターで、通る厚さに分けて、数回で裁断するんだ。

f:id:itouhiro:20081224181259j:image


f:id:itouhiro:20080902172315g:image サクッときれるもんなの?


f:id:itouhiro:20080902173503g:image サクッというほどではない。もっとチカラがいるな。文庫本や新書など紙の薄い本は、ギュッと押し込めば簡単に裁断できる。でも紙のしっかり厚い本なんかだと、取っ手に両手を乗せて体重かけてグッグッと少しずつ押し込む感じで裁断するんだ。


f:id:itouhiro:20080902172315g:image ギロチンみたいだな。


f:id:itouhiro:20080902172316g:image これは小さな子供のいる家にあると危ないと思うぞ。大人の一人暮らししているオレでも、この裁断するとこには手を通さないよう気をつけている。

これで裁断が終わって、1ページごとに1枚の紙に分離できた。


スキャン

f:id:itouhiro:20080902172316g:image 次は取り込みだ。オレの使っているドキュメントスキャナーは Canon DR-2080C というので、TWAIN(トウェイン)規格に対応しているんだ。

f:id:itouhiro:20081224181301j:image


f:id:itouhiro:20080902172315g:image お値段はどれくらい?


f:id:itouhiro:20080902172316g:image これは初期のモデルだから、12万くらいした。


f:id:itouhiro:20080902172315g:image えっ!?


f:id:itouhiro:20080902172316g:image 今は後継機が出てて、5万以下で手に入るぞ。

Canon imageFORMULA DR-2510C 2455B001

Canon imageFORMULA DR-2510C 2455B001

  • 出版社/メーカー: キヤノン
  • 発売日: 2007-11-06
  • メディア: Personal Computers


f:id:itouhiro:20080902172315g:image ……Amazonのレビューで批判されてるよ。


f:id:itouhiro:20080902172316g:image ドキュメントスキャナは、「何十ページも自動的に読み込んでくれる」という機能がすごいのであって、取り込み画質はフラットベッドスキャナ(1枚ずつ手動で紙を取り替えて取り込む) には劣るぞ。

でも一枚一枚紙を取り替えて、1日1000ページ取り込むなんてできないだろ、常識的に考えて。でもドキュメントスキャナなら1日4冊1200ページでもラクに取り込みできるんだ。


f:id:itouhiro:20080902172315g:image なるほどー。ところで重送って何?


f:id:itouhiro:20080902172316g:image 重送(じゅうそう)ってのは、1枚ずつ取りこむはずが、2枚とか3枚まとめて取りこんでしまうことだよ。ウチでは、紙が厚いときはまったく起きないけど、紙が薄い文庫本の取り込みなんかだとたまに起きることがある。取り込んだ後でチェックして、もし重送してたら再取り込みすればいい。


f:id:itouhiro:20080902172315g:image 取りこんだ後のチェック?…


f:id:itouhiro:20080902172316g:image あとで説明するよ。


TWAINに対応しているスキャナの場合、本体付属のスキャンソフト使わなくても、別のソフトを使って画像取り込みができるんだ。

ここでは BTScan http://homepage2.nifty.com/tsugu/software/ というソフトを使って取り込む。


BTScanの設定は JPEG出力品質を100%にしておく。

f:id:itouhiro:20081224191530g:image

取り込み設定はカラー本の場合、こんなだ。

f:id:itouhiro:20081224191529g:image

24ビットカラー・600dpiにしている。

明るさ・コントラストは、あとでPhotoshopで画像補正するので、あえてここでは初期値のまま変更していない。


f:id:itouhiro:20080902172315g:image 600dpiはデータとして大きすぎない?PC画面上で読むなら150〜200dpiもあれば十分でしょ。


f:id:itouhiro:20080902172316g:image パソコン関連の本は、デスクトップ画像とか細かい絵柄があってな。それをしっかり見るためには、240dpiは必要だと思う。

以下の画像は、Wordでマスターする使えるビジネス文書 レイアウトの極意のものだが、150dpiだと読むのに無理があるだろ?

f:id:itouhiro:20081224194937j:image



それに、最初は600dpiで取り込んで あとで画像補正して縮小したほうがきれいな画像になるんだ。

たとえばPC関連の本だと、以下のように最初から240dpiで取り込んだものと、600dpiで取り込んだ後で240dpiに変換したものでは、ちがうだろう?

f:id:itouhiro:20081224200112j:image


f:id:itouhiro:20080902172315g:image 240dpiのは モアレがきついねー。


f:id:itouhiro:20080902172316g:image だから最初に600dpiで取りこんで、あとから240dpiに変換するのがキレイなんだ。


f:id:itouhiro:20080902172315g:image キレイなのはわかったけど、600dpiだと、240dpiに比べても、スキャナの取り込み時間が余計に かかるんでは?


f:id:itouhiro:20080902172316g:image 3倍以上かかる感じだな。295ページあるこの本だと……取りこむのに2時間25分かかってる。


f:id:itouhiro:20080902172315g:image ゲゲッ!


f:id:itouhiro:20080902172316g:image といっても別に大変じゃないぞ。たまに20枚ずつ紙を補給する以外はほったらかしでいいんだ。2chまとめサイトやニコニコ動画とかTV見てるあいだに終わっているよ。

ちなみにハードディスク容量はカラーで取り込むと、600dpiだと1冊4GBくらい使っている。あとで240dpiに変換すれば、一冊200MBくらいに小さくなるよ。


続き: [スキャナ 書籍] 本をキレイにデジタル取り込みする方法(2) http://d.hatena.ne.jp/itouhiro/20081225