Hatena::ブログ(Diary)

やねうらお−ノーゲーム・ノーライフ このページをアンテナに追加 RSSフィード

GT-Rの買取ならここですわ。どこよりも高く買取ってもらえるはず。お勧め!GT-R 買取
電王戦出場記念! 書籍化されたで! 監修したで!(`ω´) 絶版なってしもた Kindle版で復活!! 記事書いたで!
解析魔法少女美咲ちゃん マジカル・オープン!

YaneuLabs / やねうら王公式 / やねうらおにメール / twitter / プロフィール

 | 

2009-10-17 クラッカーの教科書

[] クラッカー教科書  クラッカーの教科書を含むブックマーク  クラッカーの教科書のブックマークコメント


クラッカーの教科書


解析魔法少女美咲ちゃん マジカル・オープン!

データハウスからクラッカーの教科書が発売された。データハウス編集長から献本していただいた。


この本はアセンブラの命令に関する解説は省略してあって、中級者向けという感じ。デバイスドライバトレースや、カーネルモードデバッガに関する解説がある。あと、Haspのクラックについても簡単に解説がある。(HaspとはAladdin社のドングル)


アセンブラから学びたいという人には、私の解析魔法少女美咲ちゃん マジカル・オープン!のほうをまず読むことをお勧めしておく。何か最近になってまたこの本は売上を伸ばしているようで、何故かなーと思ったら、最近ネットランナーで紹介されたらしい。

ところで、Aladdin社の最新のHASPに関してなのだが、私のメモ代わりにざっと書きたいことを書いておく。(私のメモなので意味不明なところがあってもお許しを。)


HASPに限らず最近のドングルは、たいていドングル側にRSA暗号などの暗号keyが格納されており、ドングル側に対してそのkeyを取り出せないので、結局、ドングル側にプログラムが格納されているのと同じことである。


よって、PC←→ドングル間の通信をproxy dllを作るなどしてAPI呼び出しをhook(横取り)してしまい、ドングルを外している状態でもドングルと同じ動作をするエミュレータ的なものを用意するのが普通である。


しかし、このPC←→ドングル間の通信でやりとりされる内容が毎回同じとは限らない。何故異なる内容になるかというと、PC側で乱数を発生させて、それをseedにして何やかやをするからだ。


結局、乱数の発生のためにrandomizeをどうやってやるかという話になって、常識的には、PCタイマーの時刻を見てそれを使ってradomizeするので、このAPIhookして一定の値が返るようにしておく。


その他のパターンとして嫌らしいのは、マルチスレッドにしてあって、片方のスレッドでドングルからのリターンを待つ間、別スレッドカウンターをインクリメントしてその値がいくらになるかを見るようなケースだ。


このようにマルチスレッドを利用してrandomizeするパターンに対して、いかにして毎回同じ挙動になるようにするか、そして、このパターンをいかにして素早く発見するかが腕の見せ所である。(こういうことをするための専用のデバッガーを作ったほうが良いと思う。汎用デバッガーで複数スレッドから監視しているメモリを列挙したりするのは結構手間がかかる。)


マルチスレッドを利用したアプリケーションで、再現性のないバグに出くわすことがあるが、そういうバグを100%決まったタイミングで再現させたいときは、fiberのような疑似スレッドを用いて、スレッドスケジュールを自前でコントロールすることがある。上のようなタイププログラムクラックにも、その手法が使える。


具体的には、スレッド生成を行なうAPIhookして、実際にはスレッド生成はせずにfiberを生成するようにする。


こうしておいて、別スレッドの動作をループで待っているほうをループのなかで定期的にyieldを呼び出すようにする。ドングルエミュレータが決まったタイミングで結果を返すなら、このループのなかでインクリメントしている変数も決まった値になるはずで、毎回のプログラムの挙動が同じになる。


このように、毎回のプログラムの挙動を固定化するのがこの手のクラックの常道なのだが、この方法はそう簡単ではなく、他にもいろいろテクニックを駆使しないと達成できない。


あとは、ドングルによっては、デバッガで追いかけて条件分岐を書き換えたいところが見つかってもその部分の命令を書き換えられないことがある。その部分のバイナリは動的に生成された部分だからである。こういうときは、ハードウェアブレークポイントを設定して、そこで停止させるコードを別のところに挿入しておくとか。



まあ、いまどきのドングルクラックするには、少なくとも自分カーネルデバッガx86エミュレータを作れるぐらいでないと辛いんじゃないかという話でした。

ああ…ああ… 2009/10/17 18:13 CPU本…

神経質&神経質& 2009/10/22 16:48 コメントが少ないですね。

わからないからなんです
→(進めて)
みんなが知りたがっていることであるかもしれません。

こういうことこそ書籍として出すべきです。
法的なリスクがめにつきます。
そこでこそ「やねうマジック」を出すべきです。
そうでしょうやねう社長!

鬼才鬼才 2009/10/26 23:51 昔書籍を購入しました。内容も素晴らしく、あとがきもは座右の名にしてます。

トラックバック - http://d.hatena.ne.jp/yaneurao/20091017

2009-10-09 何故私は狂った猿のように1000万円分の書籍を切り刻んだのか

[] 何故私は狂った猿のように1000万円分の書籍を切り刻んだのか  何故私は狂った猿のように1000万円分の書籍を切り刻んだのかを含むブックマーク  何故私は狂った猿のように1000万円分の書籍を切り刻んだのかのブックマークコメント


id:yaneurao:20091001FUJITSU ScanSnap S1500 FI-S1500を買って書籍を裁断してスキャンした話を書いた。


「もうどうせ残りの本は売ってもたいしたお金にもならないし」と書いたが、取り込んだ書籍の数は3,000冊強。総スキャンページ数、262,845枚。消耗品のパッド交換4回。ローラー交換2回。1冊の平均価格は3,000円程度。全体でおおよそ1,000万円。今回は、気がついたらこれだけの本を切り刻んでいた。id:yaneurao:20060131本棚に換算すると14個分である。


たぶんアマゾンで売れば、その1/3ぐらいのお金にはなっていただろうから、ちょっともったいない気もする。私も当初はそこまで本を徹底的に切り刻む気はなかったのであまり気にもかけてなかった。


そこで、どうしてこんなことになったのか、つらつら考えてみた。


■ 切り刻まずに取り込んではいけなかったのか?


ATIZ(→ http://www.atiz.com/ )の手動ブックスキャナの購入は以前から何度も考えた。このブックスキャナ、発売当初は$3,000ぐらいだったのだが、モデルチェンジ価格改定を繰り返し、いまや$6,000ぐらいになった。あと、昨年ぐらいから日本から購入するには日本の販売代理店を通さないと購入できなくなり、日本の販売代理店見積をとってみるとカメラ2つセットで100万円ぐらいの見積が返ってきた。


しかもページめくりは手作業の上、1時間に最大でも700ページ程度しかスキャンできないので、2冊ぐらいしか取り込めない。アルバイトを時給1,000円で雇っても1冊取り込むためのコストは500円 + α(消耗品etc..) またアマゾンで売却する手間も馬鹿にはならない。アルバイトにやらせるとしても1冊あたり数百円分の手間が発生すると思う。結局、こういうコストを考えると素直に切り刻んで一気に処分してしまうほうが手っ取り早いし、値段的に見ても大差ないんじゃないかと思う。


■ 裁断機は何故必要だったのか?


「裁断機が無くてもカッターでいいんじゃね?」と思っている人がいるかも知れないが、以前私はカッターで切りながらスキャンしたが、これだと大変手間がかかった。綺麗に裁断するのに1冊につき10分ぐらいかかる。6冊で1時間。時給1,000円としても200冊ぐらいで元がとれる計算である。200冊以上スキャンするつもりなら裁断機を買わないのはどうかしていると言わざるを得ない。


あとカッターナイフで裁断すると紙のくずやチリが出るのでこれがドキュメントスキャナーに詰まってローラーを痛める原因や重複紙送りの原因になる。とてもお勧めできない。


■ 私が狂った猿のように1,000万円分の書籍を一気に切り刻んだ本当の理由


まず、本は買いそろえるときには、「物事を完全化する」という願望を満たす。これがコレクション願望の根源にあるのだと思う。全巻揃っているととても気持ちいい。それと同時に、知識を充足しているという一種の知的好奇心知的欲求を満たす。なんだか賢くなったような錯覚をする。


では、それらのコレクションが切り刻まれて失われていくときはどうなのか?そのような喪失体験には何の快楽もないかのようだが、実際はそうではない。


本棚から本が無くなると、これまたとても気持ちいいのだ。部屋が片付いたときに山登りで頂上に達したときのような達成感が得られるが、あれと同じ快楽がある。本がみるみるうちに無くなっていく。これがとても気持ちいい。アマゾンマーケットプレイスでいつ売れるのかわからない、1,2,3,4巻のうち3巻だけが売れて、残された1,2,4巻が本棚にあるのがとても気持ち悪いのとは正反対である。


このように切り刻まれた本は完全な形で本棚から消失していく。それと同時にパソコン内のハードディスクを占拠し、フォルダをあけたときにずらっとサムネイルが並ぶ。(Windows7ではpdfサムネイルが表示されるのだ) これがさきほどの本を買いそろえたときのような快楽を同時にもたらすのだ。


そして、私はpdf化された書籍を使っているうちに、その便利さに気づく。


pdfファイルは、1000ページもの本のように物理的な重さも無く、また、文庫本サイズの本でもスキャンすれば大画面で閲覧できるのでとても読みやすく、そして同時に文字列検索でき、見たい本を椅子から動かずに出してくることが出来る。デスクトップ画面(1920×1200×3画面)が許す限りどれだけでも本を同時に開くことが出来る。外出先でもリモートデスクトップで家のパソコン接続し、好きな書籍を閲覧することが出来る。


pdf化された書籍に対して、オンラインゲーム上の仮想通貨のようにそれは確かに実在するのだというような錯覚を感じはじめる。これは、現実世界を捨て、Ragnarok Onlineを狂ったようにやり続けた私だから余計にそうなのかも知れない。(「Ragnarok廃人伝説」: http://d.hatena.ne.jp/yaneurao/searchdiary?word=Ragnarok%c7%d1%bf%cd%c5%c1%c0%e2 )


ともかく、pdf化されている書籍のほうが、価値があるのだという錯覚が芽生え始めると、今度は、手にとりたい書籍本棚に存在することに激しい苛立ちを感じはじめる。何故この本はパソコンのなかにないのだ?パソコンのなかにあればキーワード検索ですぐ出てくるのに!椅子から動かずに取りにいけるのに!2秒で出てくるのに!重たくないのに!読みやすいのに!何故本棚なんかに入れてあるんだ?本棚なんていらないのに!本棚なんて邪魔なだけなのに!


特に、シリーズものを1冊切り刻んでスキャンすると、もう止まらなくなる。パソコンのなかに残りの本が無いのがとても悔しい。パソコンのなかの不完全なコレクションを見るのがとても悲しい。そして、どの本を持っているのかをチェックしてそのシリーズの新刊をアマゾンで買おうにも、本棚のほうはとても検索性が悪く、間違えて既に持っている本を買ってしまったりする。本棚なんかに本をおいておくから、こんなことになるんだ!こん畜生


もうこうなってくると末期症状であり、本棚自体が憎らしく思えてくる。本棚自体が悪の権化であり、悪存在であり、悪の巣窟で、悪の化身であり、悪の悪の悪である!(自分でも何を言っているのかよくわからないが)


シリーズものに限らず、例えば数学の本を1冊スキャンすると、他の数学関係の本が本棚にあることが耐え難くなってくる。他の数学の本が本棚にあったら、また間違えてアマゾンで買っちまうだろが!この野郎!


数学関係の本をすべて切り刻んだあと、物理現象の数学的諸原理―現代数理物理学入門なんて本を見つけて、この本のジャンル数学なのか?物理学なのか?とか考え出すと、次は物理学関係の本もスキャンしないと気が済まなくなる。


物理学をやったなら理学関係全部スキャンするだろJK!とか言って、そのスキャンが終わると、次は、どうせなら大学関係のは全部スキャンしてしまおうと思い、経済電気電子関係の本も全部解体してスキャンである。


気がつくと1ヶ月間ずーっと本を切り刻んでスキャンして過ごしていた。これだけスキャンするつもりなら最初からアルバイトを雇ってやらせたほうが良かったと思うが、当初はこんなに徹底的にするつもりは無かったのである。

wofwof 2009/10/09 07:49 本棚と本のbefore->afterが見たいです。

yaneuraoyaneurao 2009/10/09 09:22 本棚と本のbefore → このblogの上にある私のプロフィールのところの写真(がその一部)
本棚のafter → 本棚が小物用の棚として重宝。
取り込んだ本 → かさばって邪魔なのですでに処分。

たかおんたかおん 2009/10/09 09:54 そして、スキャンしたデータを消失してこの物語は終了するのですね?

ベタな落ちですがw

graphic2009graphic2009 2009/10/09 12:27 目的を果たすための行為そのものが目的になってしまった、ということですか。

udud 2009/10/09 14:37 書籍のPDF化をしたいが裁断が面倒な人へ切り刻んだ本を提供してはどうでしょうか。

katttonkattton 2009/10/09 18:40 図書館に寄贈という手もありますね。

神経質&神経質& 2009/10/09 19:32 なんでも徹底的にやらないと症候群

自分もそれで苦しめられることありますw
普通の人なら、限界がきて自然にとまるんでしょうが・・・

junmk2junmk2 2009/10/10 00:50 これだけ取り込めば、それなりに熟練したと思うのですが、一冊あたりどの位の作業時間で安定したのか教えていただけないでしょうか?

yaneuraoyaneurao 2009/10/10 02:25 > 一冊あたりどの位の作業時間で安定したのか

厚み4cmの800ページの本だとして・・

・本の裁断…カッターナイフで背を切る×2回。裁断3回。合計15秒程度。

・本のカバーと帯をハサミで半分に切るのに10秒程度。

・50ページずつ、紙をフィーダーに載せて、スキャン後の紙を移動させるのが3秒×16回。

・スキャンが終わったらファイル名を変更してフォルダに移動させるのが10秒程度。

・スキャン後の紙をまとめて段ボールにつめて処分するのに10秒程度。

なので手間的には、1冊2分ぐらいなのかなぁと思っています。スキャン中に並行して他の作業を問題なくこなせることが大前提ですけど。

何かの法律とか何かの法律とか 2009/10/10 05:06 切り刻んだ本を処分しちゃうと問題があるような・・・

 2009/10/10 16:47 そして最終的には自分自身をデータ化し電子世界へと旅立つ近未来SFですねわかります

簡単な外挿簡単な外挿 2009/10/10 21:55 あなたは物理的蔵書数0では飽きたらず負にしたくなる…!
矢継ぎ早に本を出版し始める…!!

endo_5501endo_5501 2009/10/10 22:19 質問ですー。
本によっては、2ページ以上同時に読み込んでしまいやすい紙質のものもあると思うのですが、そういうのどうやってフォローしていますか?僕も電子化ぼちぼちしているんですが、そういうのを見つけ出して、再スキャンしなおすのがすごく面倒です・・・

通る人通る人 2009/10/11 03:34 おもしろそうなのでやってみようかな。

yaneuraoyaneurao 2009/10/11 04:46 > 本によっては、2ページ以上同時に読み込んでしまいやすい紙質のものもあると思うのですが、そういうのどうやってフォローしていますか?

重複紙送りになりやすい紙は、薄手の紙ですね。パッドが消耗してくると特に薄手の紙は重複紙送りになりやすいです。パッド交換の目安は、5万枚ですが、実は3万枚すぎたころから、薄手の紙に対しては重複紙送りが発生しやすくなります。また、厚手の紙であれば7万枚ぐらいまでは問題なく取り込めます。

よって、薄手の紙は、パッド交換をしてすぐに取り込み、厚手の紙のものはなるべく後回しにしてパッド交換をなるべく引き延ばすのがコツです。

あと、重複紙送りになったかどうかは、超音波でチェックするモードでチェックしています。裁断機を使って裁断しているので、二つのページがくっついていることはほとんどあり得ないので、超音波でチェックする限りは、ほとんど重複紙送りは発生していないと考えて良いです。(最初の20冊ほどをチェックした限りは、超音波モードでの誤検知は存在しなかったので、そこそこ低確率だと判断しました。)

ただ、何十冊に一冊ぐらいの割合で、重複紙送りが検知されていないことはあるかも知れませんが、そういうのまで気にしていたらスキャンに手間がかかりすぎるのでそこまでやらないほうがいいかと思います。

そこで、私は、自分がpdfで読んだときに、そのページが存在しなくて、かつ、そのページが必要不可欠だと思ったら、その本をまた買ってそのページだけスキャンすればいいだけのことだと割り切っています。

電子化は無料でできるものではなく、それ相応のコストが必要なのだと考えれば、そういう出費も許せます。どうせ、本棚が何十もあれば倉庫を借りたりして、そういう出費が必要なのですから、結局、所有状態を維持するのには維持費がかかるのは当たり前だという考え方をするべきなのかなと。

endo_5501endo_5501 2009/10/11 12:15 > パッドが消耗してくると特に薄手の紙は重複紙送りになりやすいです。
確かに、現在約4万5千枚くらいなので大分へたってそうです。これを機に交換しようかと思います。
> 私は、自分がpdfで読んだときに、そのページが存在しなくて、かつ、そのページが必要不可欠だと思ったら、その本をまた買ってそのページだけスキャンすればいいだけのことだと割り切っています。
あーうー。僕はそこまで割り切れないので、地道にチェックしていくことにします(それ相応のコストということで)

通りすがり通りすがり 2009/10/11 19:57 あ、そうか。考えてみたら、倉庫として借りているアパート代金って1ヶ月で2万9千円だから3ヶ月で元取れるのか!!!まあ、置いているのが本だけじゃないから実際は駄目なんだけど。

どうせだったらどうせだったら 2009/10/11 20:55 PDFからページ番号を画像抽出して、ページ番号の振ってある範囲で抜けをチェックするプログラムを作るべきでは。
ページ番号の無い書籍や番号の振られていない目次などの範囲の抜けには対処できませんが、確率やその範囲の重要性を考えるとかなり問題の発生率を落とせそうです。

検査ツールの作成の手間は・・・あなたなら・・・っ

hiyahiya 2009/10/11 22:43 アルバイト時給1000円って・・・
急かないのであれば、その半額でも高いんではないでしょうか?
それだけつらい作業なんですね…

yaneuraoyaneurao 2009/10/12 04:12 > 確率やその範囲の重要性を考えるとかなり問題の発生率を落とせそうです。

まあ、抜けがあるかどうかの判定だけなら、同じページが2回出現しないことを前提として、本のNページ目がpdfファイルのaページ目だとしたら、pdfファイルの最終ページbは、本の(b - a + N)ページ目でなければならないので、最初と最後だけチェックすれば抜けがあるかどうかの判定は手作業でもすぐにできるんですけどね。

> 急かないのであれば、その半額でも高いんではないでしょうか?

平成21年9月30日以降の大阪府の最低賃金は時給762円でございます(´ω`) まあ、半分ボランティアでやってくれる人なら、時給300円ぐらいでもいいのかも知れませんけども。

yaneuraoyaneurao 2009/10/12 18:03 > あーうー。僕はそこまで割り切れないので、地道にチェックしていくことにします(それ相応のコストということで)

endo_5501さんに質問なのですが、そんなにページが欠けたりするでしょうか?超音波で検知してて、重複紙送りが検知されない確率って相当低いと思うのですが。機種はS1500ですよね?

だとすれば、ひょっとして、http://d.hatena.ne.jp/yaneurao/20091001 の追記1.に書いた現象ではないでしょうか?(私はこれでちょっとハマりました)

endo_5501endo_5501 2009/10/12 22:55 いえ、僕が使用しているのはS510でした。重複紙送りの検知に良く失敗するのはそのためと思います。
これまで、S1500がそこまで重複紙送りの検知能力が高まっている事は知らなかったので(読み取り速度が上がっただけと思ってました)、前回コメント後、だったらS1500買った方がいいんじゃね?と思い、買ってきてしまいました。現在使って色々比較しています。今の所、良い感じに動いています。

yaneuraoyaneurao 2009/10/13 07:07 > 現在使って色々比較しています。

おお、比較レポートとかお待ちしてます(´ー`)b

aoiaoi 2009/10/14 16:07 棚14個分は現在どうなってるんでしょう?

yaneuraoyaneurao 2009/10/14 18:02 > 棚14個分は現在どうなってるんでしょう?

本棚に入れてなかったぶんもあり、実際に空いた本棚は5個です。空いた本棚は小物置きに使っていますが、2個は不要と言えば不要なのでこのブログの読者プレゼントにでもしようと考えています。

NariNari 2009/10/19 06:19 裁断機の歯の磨耗による切れ味の劣化は
ありましたでしょうか?

yaneuraoyaneurao 2009/10/19 11:55 > 裁断機の歯の磨耗による切れ味の劣化

3000冊裁断した現在、少し切れ味は悪くなった気がしますが、体重を乗せれば普通に裁断できています。歯は取り外せるので研げばいいらしいのですが、それはいまのところしていないです。

まあ、なんにせよ、この裁断機は一生モノだと思いますよ。

watowato 2009/10/29 16:07 こんにちは。僕もCD、DVD、書籍、書類、すべてをPCに格納することを夢見ていますので、大変参考になりました。実にうらやましい。気持ちいいでしょうね〜。

SNSN 2014/04/11 20:37 5年近く前のエントリーにいまさら質問してすみません。
同機種を同時期くらいに購入したのですが、手動裁断で数冊処理しただけで宝の持ち腐れになってしまってます。
一番の懸念は、電子化した後の保存法なのです。紙であれば火事やよっぽどヒドイ虫食いにでもならない限りは読むことが出来ますが、電子化した場合はハードディスクの故障やDVD-Rならば読み取り不能などどんな記憶媒体でも物理的な限界があると思います。
バックアップを取っておくにしてもそちらも壊れないという保証はないですし。
その辺はどのように対処しておられますでしょうか?

yaneuraoyaneurao 2014/04/11 21:19 ↑USB接続の外付けHDD 3台にミラーリングしています。うち1台のHDDは物理的に離れた場所(実家のパソコン)に接続して、実家にはVPNでつないでFreeFileSyncというミラーリング用のソフトでミラーリングしています。あとデータはBD-Rにも焼いてます。

またHDDは、数年ごとに買い換えて(以前と同じ値段なのに容量が倍になっていくので…)、そちらに移動させ、古いほうのHDDは物置においてあります。そういう意味では古いデータはかなり多重にバックアップしてあることになりますね。

SNSN 2014/04/12 11:26 なるほど、3重以上のバックアップというわけですね。
ご回答有難うございました。フリーソフトのご紹介も含めて大変参考になりました。

2009-10-08 Wacomの新タブレットBambooは、指タッチ対応

[] Wacomの新タブレットBambooは、指タッチ対応  Wacomの新タブレットBambooは、指タッチ対応を含むブックマーク  Wacomの新タブレットBambooは、指タッチ対応のブックマークコメント

Wacom Bamboo Art Master CTH-661/S2

Wacomから10月3日に発売された新BambooシリーズひとつであるWacom Bamboo Art Master CTH-661/S2

を購入した。


従来のペンタブレットの機能に加え、指でのタッチが出来るらしいので、Windows7でのマルチタッチ対応アプリの開発テストに使えるかと思って購入した。


私が見たときはWacomの直販で買うよりAmazonで買うほうが安かったのでAmazonで購入した。


私が購入したWacom Bamboo Art Master CTH-661/S2

は、18000円前後。Photoshop Elements7(Mac版は6)、Painter Essentials4のWindows版/Mac版が付属していて、結構お買い得だと思った。


一番安いモデルWacom Bamboo Fun CTH-461/S0だ。こちらは、12000円弱で購入できる。こちらもPhotoshop Elements7(Mac版は6)、Painter Essentials4などがバンドルされている。

さて、問題の使い心地だが、左にあるボタンは4つあり、それぞれのボタンマウスダブルクリック右クリックなどを自由に割り当てることが出来る。defaultでは一番上のボタンは、タッチ入力ON/OFFが割り当たっている。


ペンを使うときはタッチ入力を無効にしておかないと手がタブレット表面に接触すると入力されたと感知してしまうためマウスカーソルの誤動作の原因となる。ペン入力タッチ入力を併用しようと思うと手をペンタブレット表面に接触しないように浮かせておかないといけないため、使いづらいと思う。


付属Painter Essentials4の場合、タッチ入力で2本の指を使うことによってキャンバスを拡大・縮小・回転・移動が出来るので、タッチ入力と併用したいところだが、上に書いたように誤動作の原因となるので、結局タッチ入力ON/OFFを切り替えながら使うことになる。だから、左サイドのボタンタッチ入力ON/OFFが割り当たっているのは都合が良い。


また、私はタッチ入力はそれほど使いやすいとは思わなかった。ノートパソコンのサムパッドが巨大化しただけのものだと言えばわかりやすいだろうか。思い通りに操作するのが大変である。あと、Windows7RTMインストールして使ったところ、ジェスチャー入力タッチでは出来なかった。これは修正待ち。


あと、Windows7のペイントは、マルチタッチによってキャンバスに同時に線を描くことが出来るはずなのだが、この製品タッチ入力ではそれが出来なかった。


Windows7のペン入力機能(これはVistaについていたのと同等の機能)は正常にペン/タッチ入力で文字を書いて認識させることが出来た。OneNote 2007もペン/タッチ入力ともに正常に動作した。OneNoteでのペンでの書き心地はとても良い。タッチ入力でも使えるがこちらはとても使いにくい。タッチしたところに直接線を描けると良いのだが、タッチは移動しか出来ないので線を描きたければタブレットの左サイドにあるボタンマウスの左クリックを割り当てて、そのボタンを押しながらタッチしなければならない。これではマウス操作のほうがマシだと思う。


あとタッチ入力自体は静電結合方式らしく、カタログによると2点検出と書かれている。3点以上の同時入力が出来るのかどうかは謎である。


まあ、結局のところ、以上のような仕様なので現状ではマルチタッチ実験用には使えないと思う。


それからWindows7の問題なのかどうかは知らないが、このタブレット接続しているとスリープからの復帰に失敗することがある。まあ…Windows7の正式発売後には直っていることを祈る。


Bambooタッチ入力機能は期待していたほどではなかったが、タッチ入力に対応しているアプリならばうまく使えば便利だと思う。バンドルされているアプリも悪くはないしタブレットとしてはお買い得だと思う。

トラックバック - http://d.hatena.ne.jp/yaneurao/20091008

2009-10-01 裁断機×ブックスキャナ新生活

[] 裁断機×ブックスキャナ新生活  裁断機×ブックスキャナ新生活を含むブックマーク  裁断機×ブックスキャナ新生活のブックマークコメント


5年ほど前にfi-5110EOXを買い、そのあと、レゴで作った半自動ページスキャナ + デジカメオンラインドキュメント化を進めた私であったが、結構、手間暇がかかるので、優先順位の低い本は後回しになっていた。


もうどうせ残りの本は売ってもたいしたお金にもならないし、それならばと残りの本は全部裁断してドキュメントスキャナで取り込むことにした。


fi-5110EOXを久しぶりに物置から出してきた。WindowsVista用のドライバWindows7に入れれば本体自体は使えるようになったが、ローラーが摩耗していてページの重複送りが頻繁に発生する。ローラーを買い換えるぐらいなら、最新のドキュメントスキャナを買っちゃえ!とFUJITSU ScanSnap S1500 FI-S1500を買った。アマゾンで37,910円である。


あと、裁断機もいいやつを買おう!と思って、プラス 断裁機 裁断幅A4 PK-513L 26-106を買った。アマゾンで34,650円であるが、これはYahoo!ショッピングストアで31,000円だったのでそちらで買った。


まず手始めに300冊ほど取り込んでみたので以下にレビューを書いておく。


■ 裁断機


プラス 断裁機 裁断幅A4 PK-513L 26-106

15mmぐらいまでならスパっと切れる。切れ味抜群。力はそれほどいらない。上半身体重をかければ楽々切れる。切断面は綺麗。LEDライト物差しがついているので本の端にLEDライトがくる位置でまず合わせて、そこから10mmほど奥に本を移動させて切れば、たいていの本はいい感じのところで切れる。


15mmより厚みのある本は台にセットしたときに引っかかって奥(切断する歯のついているほう)に移動させることが出来ない。要するにどうやっても切ることは不可能で、これは、この上位機種との差別化のためにこうなっているのかも知れない。


しかし厚い本でもカッターナイフで背を切っていくつかに分ければ問題ナシ。たいして手間はかからない。長く使えそうだしとてもいい買い物だと思った。


■ ScanSnap S1500


FUJITSU ScanSnap S1500 FI-S1500

ともかく高速。カラースーパーファインでも1分間に20枚(40ページ)の取り込み速度。超音波で重複紙送りをチェックするので重複紙送りになっていればほぼ間違いなく停止する。ただし、ご飯粒などでくっついていて一枚の紙のように見える場合は、停止しない。


たぶん、重複紙送りになると上のローラーと下のローラーでわずかに回転数が異なり、出口付近に到達するまでに上の紙と下の紙がずれていくのでそれを検知しているのではないかと思う。


重複紙送りの発生頻度自体は、富士通の初期のブックスキャナ(fi-5110EOX)からあまり改善されていないように感じるが、検知技術は格段に進歩していると思う。

重複紙送りの頻度は上質紙ならば1500ページに1回ぐらいの割合。要するにほとんど発生しない。薄い紙の本だと100ページに1回ぐらいの割合。10年前の週刊少年ジャンプだと40ページに1回ぐらいの割合。


底面がヒートシンクとしてアルミ製になっているのだが、ここが結構熱を持つ。3000ページぐらい一気に取り込むとかなり熱かった。あまり熱いと熱でローラーが変形して重複紙送りが増えると思うので連続運用には気をつけたほうがいいと思う。


付属ソフトとして、日本語OCRがついていて、文字列で中身が検索できるpdfファイルが作れる。OCRバッチ処理できるので取り込むだけ取り込んで寝ている間にOCRをさせるという使い方が出来る。OCRの速度は、1ページ2秒前後で、取り込むのと同じぐらいの時間を覚悟したほうがいいと思う。まあ、寝ているときにまとめてやるのがいいのではないかと思う。


OCR認識精度は、完璧にはほど遠いが(認識率はたぶん90%前後)、本文を何らかのキーワード検索するぐらいの目的であれば使えなくはない。これは探しものをしているときに結構便利だと思った。


feederには、30枚ぐらいずつ載せるといい感じ。80枚ぐらいでも載るには載るが紙の自重でページを送れなくなり停止することがあるので載せすぎは禁物。しかし枚数が少なすぎると薄い紙だと重複紙送りが発生しやすい気がする。


あと、いくつかバグを見つけた。ひとつオンラインアップデートで修正されるので良いとして、残り二つはまだ修正されていない。

現象1 : ScanSnap OrganizerがMy ScanSnapというフォルダに追加されたファイルスキャンするようで、取り込み中のテンポラリファイルアクセスして、テンポラリファイルがlockされるためか、テンポラリファイルの書き出しに失敗することがある。800ページほどの本を取り込んでfinalizeしているときにpdfへの書き出しに失敗して半泣きになった。ScanSnap Organizerは、ブックスキャン時は起動させないようにして運用すべし。


現象2 : 縦長の紙(本の帯)をスキャンさせようとすると、メモリエラーで落ちることがあった。たぶん傾き補整のときのバッファが足りてないのか…。

原因判明→Scanしたファイルの出力先をScanSnap Organzierの表示フォルダにするとScanSnap Organizerがファイルロックしてしまい、テンポラリファイルの書き出しに失敗するのが原因っぽい。


また、スキャン完了後に自動的にOCRをさせる設定にしていると、その間、次のスキャンが出来ない。なんだそりゃ…。まあ、↑のバグを回避しなくてはならないので、結局、まとめて取り込んで、そのあとにScanSnap Organizerを立ち上げて、OCRをさせなさいということかな。


■ まとめ


裁断機×ScanSnap S1500の組み合わせはいい買い物だと思った。ScanSnap S1500のほうにはやや不満もあるが(本当は重複紙送りを検知して自動的にリトライして欲しい)、実用上は十分許せる範囲。買い換えてよかったと思う。


本は1冊は中身が白黒ならスーパーファインで400ページのものが100MB程度のpdfになる。1万冊でも1TBのHDDに収まる計算だ。本が邪魔で仕方ないという方はこれを機に電子ドキュメント化してはどうだろうか。


■ 追記(2009年9月11日)


このScanSnap S1500を使っていてハマった点をいくつか書いておく。


1. スキャン中に、feederに紙を載せすぎて、feedに失敗したとき、そのひとつ前のスキャン中にジャムった扱いにされてしまう。すなわち、一枚、排出口にある紙をfeederに戻す必要があるのだが、これを怠ると1枚スキャンデータが欠けてしまう。


ジャムったときには、「ここまでスキャンできています」というプレビューが表示されているが、そのプレビューが小さすぎて、書籍だとどのページなのかすら確認できない。何を思ってこんな小さなプレビュー表示にしているのかは知らないが、とても不親切だと感じる。


ともかく、結局、原稿ジャム扱いになったときは、1枚feederに戻すのを忘れずにということである。


2. 上でも書いたが、Scanしたファイルの出力先をScanSnap Organzierの表示フォルダにするとScanSnap Organizerがファイルロックしてしまい、テンポラリファイルの書き出しに失敗するようだ。注意しよう。それ以外にも、ScanSnap Organzier起動中にScanするのは何かと動作が不安定になるような気がする。ScanSnap Organzierを起動しているとScan中に何度かScan Managerがエラーで終了することがあった。どういう条件かはよくわからないのだが。

uprupr 2009/10/01 06:23 PDFはちょっとお勧めできない…
jpegの方がフリーでいいビューアいろいろありますよ
zipのまま読めるのもありますし

他力本願他力本願 2009/10/01 10:33 susieのスライドショーが最強。

DocuWorksDocuWorks 2009/10/01 13:46 スキャン後の管理はDocuWorksというソフトがおすすめですよ。
ScanSnapと連携させるツールもいろいろ出ているみたいだし。

yaneuraoyaneurao 2009/10/01 15:28 > jpegの方がフリーでいいビューアいろいろありますよ

OCRをかけてpdf化すると本文の文字列で検索ができるんです。あとScanSnapにはAcrobat9がついているのでpdfの編集にも困りませんし。だもんで、pdfもそんなに悪くはないです。

> スキャン後の管理はDocuWorksというソフトがおすすめですよ。

はい。以前買おうかと思って検討してました。ただ、私の使用目的からすると、いまはScan後は、フォルダ分けして、
[作者名] 書籍名_書籍発売日(or 発売年度)
みたいなファイル名にしてFileSeeker3というフリーソフトで検索をかけて使っているのですが、それで十分かなという感じです。

白砂青松白砂青松 2009/10/01 20:15 http://chama258.seesaa.net/article/129257684.html
やねうらお=遠山雄亮説w

yaneuraoyaneurao 2009/10/01 21:43 すごくタイムリーですね!

あ 2009/10/05 09:47 ためになる

CYSCYS 2009/10/06 05:19 非常に勉強になります。
> レゴで作った半自動ページスキャナ + デジカメ
マインドストームNXTで作られていたものだと思うのですが、
どのようになったのか物凄く知りたいです。
YANEU LEGO WORKSも拝見させて頂いていたのですが、
是非、こちらの更新もお願いします。m(_ _)m

yaneuraoyaneurao 2009/10/07 05:53 > どのようになったのか物凄く知りたいです。

了解。長くなるので、近いうちに記事を起こします。

SABAKUSABAKU 2009/10/08 21:13 こんにちは、今OCRソフトってそんなに識字率高いですか?
スキャナーについてきた読んでココっていうソフト、使い物に
ならなくて、お蔵入りなんですけど。

yaneuraoyaneurao 2009/10/08 22:06 読んでココは確かにひどかった気がします。識字率で言うと30%〜50%程度だったような…。このスキャナに付属のOCRは、識字率で言うと80%〜90数%ぐらいではあるので、まあキーワード検索するの使うなら許せる範囲ではあります。

 | 

1900 | 01 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2013 | 01 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2014 | 01 | 02 | 03 | 04 | 06 | 08 | 10 | 11 | 12 |
2015 | 01 | 02 |


Microsoft MVP
Microsoft MVP Visual C# 2006.07-2011.06