Hatena::ブログ(Diary)

やねうらお−ノーゲーム・ノーライフ このページをアンテナに追加 RSSフィード

GT-Rの買取ならここですわ。どこよりも高く買取ってもらえるはず。お勧め!GT-R 買取
電王戦出場記念! 書籍化されたで! 監修したで!(`ω´) 絶版なってしもた Kindle版で復活!! 記事書いたで!
解析魔法少女美咲ちゃん マジカル・オープン!

YaneuLabs / やねうら王公式 / やねうらおにメール / twitter / プロフィール

 | 

2009-10-01 裁断機×ブックスキャナ新生活

[] 裁断機×ブックスキャナ新生活  裁断機×ブックスキャナ新生活を含むブックマーク  裁断機×ブックスキャナ新生活のブックマークコメント


5年ほど前にfi-5110EOXを買い、そのあと、レゴで作った半自動ページスキャナ + デジカメオンラインドキュメント化を進めた私であったが、結構、手間暇がかかるので、優先順位の低い本は後回しになっていた。


もうどうせ残りの本は売ってもたいしたお金にもならないし、それならばと残りの本は全部裁断してドキュメントスキャナで取り込むことにした。


fi-5110EOXを久しぶりに物置から出してきた。WindowsVista用のドライバWindows7に入れれば本体自体は使えるようになったが、ローラーが摩耗していてページの重複送りが頻繁に発生する。ローラーを買い換えるぐらいなら、最新のドキュメントスキャナを買っちゃえ!とFUJITSU ScanSnap S1500 FI-S1500を買った。アマゾンで37,910円である。


あと、裁断機もいいやつを買おう!と思って、プラス 断裁機 裁断幅A4 PK-513L 26-106を買った。アマゾンで34,650円であるが、これはYahoo!ショッピングストアで31,000円だったのでそちらで買った。


まず手始めに300冊ほど取り込んでみたので以下にレビューを書いておく。


■ 裁断機


プラス 断裁機 裁断幅A4 PK-513L 26-106

15mmぐらいまでならスパっと切れる。切れ味抜群。力はそれほどいらない。上半身体重をかければ楽々切れる。切断面は綺麗。LEDライト物差しがついているので本の端にLEDライトがくる位置でまず合わせて、そこから10mmほど奥に本を移動させて切れば、たいていの本はいい感じのところで切れる。


15mmより厚みのある本は台にセットしたときに引っかかって奥(切断する歯のついているほう)に移動させることが出来ない。要するにどうやっても切ることは不可能で、これは、この上位機種との差別化のためにこうなっているのかも知れない。


しかし厚い本でもカッターナイフで背を切っていくつかに分ければ問題ナシ。たいして手間はかからない。長く使えそうだしとてもいい買い物だと思った。


■ ScanSnap S1500


FUJITSU ScanSnap S1500 FI-S1500

ともかく高速。カラースーパーファインでも1分間に20枚(40ページ)の取り込み速度。超音波で重複紙送りをチェックするので重複紙送りになっていればほぼ間違いなく停止する。ただし、ご飯粒などでくっついていて一枚の紙のように見える場合は、停止しない。


たぶん、重複紙送りになると上のローラーと下のローラーでわずかに回転数が異なり、出口付近に到達するまでに上の紙と下の紙がずれていくのでそれを検知しているのではないかと思う。


重複紙送りの発生頻度自体は、富士通の初期のブックスキャナ(fi-5110EOX)からあまり改善されていないように感じるが、検知技術は格段に進歩していると思う。

重複紙送りの頻度は上質紙ならば1500ページに1回ぐらいの割合。要するにほとんど発生しない。薄い紙の本だと100ページに1回ぐらいの割合。10年前の週刊少年ジャンプだと40ページに1回ぐらいの割合。


底面がヒートシンクとしてアルミ製になっているのだが、ここが結構熱を持つ。3000ページぐらい一気に取り込むとかなり熱かった。あまり熱いと熱でローラーが変形して重複紙送りが増えると思うので連続運用には気をつけたほうがいいと思う。


付属ソフトとして、日本語OCRがついていて、文字列で中身が検索できるpdfファイルが作れる。OCRバッチ処理できるので取り込むだけ取り込んで寝ている間にOCRをさせるという使い方が出来る。OCRの速度は、1ページ2秒前後で、取り込むのと同じぐらいの時間を覚悟したほうがいいと思う。まあ、寝ているときにまとめてやるのがいいのではないかと思う。


OCR認識精度は、完璧にはほど遠いが(認識率はたぶん90%前後)、本文を何らかのキーワード検索するぐらいの目的であれば使えなくはない。これは探しものをしているときに結構便利だと思った。


feederには、30枚ぐらいずつ載せるといい感じ。80枚ぐらいでも載るには載るが紙の自重でページを送れなくなり停止することがあるので載せすぎは禁物。しかし枚数が少なすぎると薄い紙だと重複紙送りが発生しやすい気がする。


あと、いくつかバグを見つけた。ひとつオンラインアップデートで修正されるので良いとして、残り二つはまだ修正されていない。

現象1 : ScanSnap OrganizerがMy ScanSnapというフォルダに追加されたファイルスキャンするようで、取り込み中のテンポラリファイルアクセスして、テンポラリファイルがlockされるためか、テンポラリファイルの書き出しに失敗することがある。800ページほどの本を取り込んでfinalizeしているときにpdfへの書き出しに失敗して半泣きになった。ScanSnap Organizerは、ブックスキャン時は起動させないようにして運用すべし。


現象2 : 縦長の紙(本の帯)をスキャンさせようとすると、メモリエラーで落ちることがあった。たぶん傾き補整のときのバッファが足りてないのか…。

原因判明→Scanしたファイルの出力先をScanSnap Organzierの表示フォルダにするとScanSnap Organizerがファイルロックしてしまい、テンポラリファイルの書き出しに失敗するのが原因っぽい。


また、スキャン完了後に自動的にOCRをさせる設定にしていると、その間、次のスキャンが出来ない。なんだそりゃ…。まあ、↑のバグを回避しなくてはならないので、結局、まとめて取り込んで、そのあとにScanSnap Organizerを立ち上げて、OCRをさせなさいということかな。


■ まとめ


裁断機×ScanSnap S1500の組み合わせはいい買い物だと思った。ScanSnap S1500のほうにはやや不満もあるが(本当は重複紙送りを検知して自動的にリトライして欲しい)、実用上は十分許せる範囲。買い換えてよかったと思う。


本は1冊は中身が白黒ならスーパーファインで400ページのものが100MB程度のpdfになる。1万冊でも1TBのHDDに収まる計算だ。本が邪魔で仕方ないという方はこれを機に電子ドキュメント化してはどうだろうか。


■ 追記(2009年9月11日)


このScanSnap S1500を使っていてハマった点をいくつか書いておく。


1. スキャン中に、feederに紙を載せすぎて、feedに失敗したとき、そのひとつ前のスキャン中にジャムった扱いにされてしまう。すなわち、一枚、排出口にある紙をfeederに戻す必要があるのだが、これを怠ると1枚スキャンデータが欠けてしまう。


ジャムったときには、「ここまでスキャンできています」というプレビューが表示されているが、そのプレビューが小さすぎて、書籍だとどのページなのかすら確認できない。何を思ってこんな小さなプレビュー表示にしているのかは知らないが、とても不親切だと感じる。


ともかく、結局、原稿ジャム扱いになったときは、1枚feederに戻すのを忘れずにということである。


2. 上でも書いたが、Scanしたファイルの出力先をScanSnap Organzierの表示フォルダにするとScanSnap Organizerがファイルロックしてしまい、テンポラリファイルの書き出しに失敗するようだ。注意しよう。それ以外にも、ScanSnap Organzier起動中にScanするのは何かと動作が不安定になるような気がする。ScanSnap Organzierを起動しているとScan中に何度かScan Managerがエラーで終了することがあった。どういう条件かはよくわからないのだが。

uprupr 2009/10/01 06:23 PDFはちょっとお勧めできない…
jpegの方がフリーでいいビューアいろいろありますよ
zipのまま読めるのもありますし

他力本願他力本願 2009/10/01 10:33 susieのスライドショーが最強。

DocuWorksDocuWorks 2009/10/01 13:46 スキャン後の管理はDocuWorksというソフトがおすすめですよ。
ScanSnapと連携させるツールもいろいろ出ているみたいだし。

yaneuraoyaneurao 2009/10/01 15:28 > jpegの方がフリーでいいビューアいろいろありますよ

OCRをかけてpdf化すると本文の文字列で検索ができるんです。あとScanSnapにはAcrobat9がついているのでpdfの編集にも困りませんし。だもんで、pdfもそんなに悪くはないです。

> スキャン後の管理はDocuWorksというソフトがおすすめですよ。

はい。以前買おうかと思って検討してました。ただ、私の使用目的からすると、いまはScan後は、フォルダ分けして、
[作者名] 書籍名_書籍発売日(or 発売年度)
みたいなファイル名にしてFileSeeker3というフリーソフトで検索をかけて使っているのですが、それで十分かなという感じです。

白砂青松白砂青松 2009/10/01 20:15 http://chama258.seesaa.net/article/129257684.html
やねうらお=遠山雄亮説w

yaneuraoyaneurao 2009/10/01 21:43 すごくタイムリーですね!

あ 2009/10/05 09:47 ためになる

CYSCYS 2009/10/06 05:19 非常に勉強になります。
> レゴで作った半自動ページスキャナ + デジカメ
マインドストームNXTで作られていたものだと思うのですが、
どのようになったのか物凄く知りたいです。
YANEU LEGO WORKSも拝見させて頂いていたのですが、
是非、こちらの更新もお願いします。m(_ _)m

yaneuraoyaneurao 2009/10/07 05:53 > どのようになったのか物凄く知りたいです。

了解。長くなるので、近いうちに記事を起こします。

SABAKUSABAKU 2009/10/08 21:13 こんにちは、今OCRソフトってそんなに識字率高いですか?
スキャナーについてきた読んでココっていうソフト、使い物に
ならなくて、お蔵入りなんですけど。

yaneuraoyaneurao 2009/10/08 22:06 読んでココは確かにひどかった気がします。識字率で言うと30%〜50%程度だったような…。このスキャナに付属のOCRは、識字率で言うと80%〜90数%ぐらいではあるので、まあキーワード検索するの使うなら許せる範囲ではあります。

 | 

1900 | 01 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2013 | 01 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2014 | 01 | 02 | 03 | 04 | 06 | 08 | 10 | 11 | 12 |
2015 | 01 | 02 |


Microsoft MVP
Microsoft MVP Visual C# 2006.07-2011.06