光学文字認識(Optical Character Recognition)。
イメージスキャナなどで読み取った文書画像を解析し文字データを抽出し、電子テキスト化すること。
類似文字 OCR3→GIANT製の自転車の名称、光学文字認識できる自転車ではない。
真っ白な紙だと全然私の字読み取ってくれなかったのに!w 今日も美味しく飲みましょう♪ 呑野まこと(のみのまこと)です♪ 『私は、縛られない!!』 という厨二っぽい理由で、小説を手書きする時は真っ白な紙に書くことが多かったですw のびのび書きたくて。 線になんて添ってられっか、とw 以前スキャンアプリを色々試していた時、真っ白な紙だと毎回読み取りが惜しくて面白解釈になちゃってw 最近は、手書き執筆→そのままスキャン→手入力不要♪の流れをほぼ諦めてました。 でも近頃手書きの方が執筆捗るんです。 楽しいし。 どうしても手書きを諦めきれない!! でも後で入力するのは非常にめんどくさい!!w 未練ったら…
石碑を解読するようになって困ったこと。それは・・・ 「文字が読めない!」ことです。 まぁ、一般の方よりは書というものに触れてきた時間が長いと思いますので、草書や仮名でもある程度はスラスラ読める自信はあります。ましてや、過去に石碑を研究され出版された本がありますので、大部分頼ってこのブログを書いてます。 ですが、それでも読めない字に遭遇するのです。そんな時は字書(過去の文字資料を集めた辞書)と睨めっこしながら字を探していくのですが、「もうちょっと楽できないかな?」と探していたら見つけました。 みを(miwo):AIくずし字認識アプリ codh.rois.ac.jp なんて素晴らしい!!OCRで古…
株式会社神戸デジタル・ラボ DataIntelligenceチームの原口です。 今回は、GitHubで公開されているAIモデル「EasyOCR」を用いて文字認識に取り組みます! 本稿は、以下の条件に当てはまる方を想定して発信します。 Pythonが利用できる方 新しい技術に興味がある方 文字認識に興味がある方 OCRとは? 利点1:認識した文字をデータとして利用することができる 利点2:他言語へ簡単に翻訳できる EasyOCRとは? 準備 実際に検出してみた まとめ OCRとは? OCRの流れ OCR(Optical Character Recognition または Reader)とは、紙面…
データ入力の時間を短くしたい。製品の加工履歴の手書きの帳票があり、そのデータを月初にデータベースに入力し直している。加工現場にはパソコンがないエリアがあり、直接パソコンで入力できない従業員がいる。また、加工履歴は加工の証拠になるので後から書き直してはいけない。そのため、いまでも手書きを続けている。 手書きの帳票を自動でパソコンに取り込めるツールもある。Adobe AcrobatなどのOCR機能である程度はデジタルデータとして認識できる。しかし、精度は十分とは言いがたい。シリアルナンバーの時など、ゼロ(0)とオー(o)を逆に認識してしまうことも多い。 先日、入出荷担当のところに行った時に、ヤマト…
概要 使い方 まとめ 概要 gcv2ocrは、Google Cloud Vision OCR出力からhocrに変換して、検索可能なpdfを作成するリポジトリです。 https://github.com/dinosauria123/gcv2hocr 今回、上記リポジトリをGoogle Colabで実行するノートブックを作成しました。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/gcv2hocr%E3%81%AE%E5%AE%9F%E8%A1%8C%E3%82%B5%E3%83%B3%E3%83%97…
概要 Google Colabを用いたNDLOCRアプリを作成し、以下の記事で紹介しました。 nakamura196.hatenablog.com 今回は、上記ノートブックの改良版であるVersion 2を作成しましたので紹介します。以下からノートブックにアクセスいただけます。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/ndl_ocr_v2.ipynb 特徴 複数の入力形式に対応しました。以下のオプションを使用できます。 画像 単一の画像ファイルのURLを指定する場合 単一の画像ファイルをアップ…
設定 Googleドライブの場合 (参考)GCS(Google Cloud Storage)の場合 まとめ 先日、以下の記事を執筆しました。 nakamura196.hatenablog.com 今回は、Google Colabを用いたNDLOCRの実行にかかる時間について、かんたんな調査を行なったので、その結果をまとめます。 設定 GPUは以下です。 Fri Apr 29 06:26:29 2022 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 460.…
概要 ノートブック 実行方法 入力フォルダの準備 ノートブックの実行:1.初期セットアップ ノートブックの実行:2.設定 ノートブックの実行:3.実行 まとめ 追記 2022.05.02 2022.04.30 概要 前回、Google Cloud PlatformのCompute Engineを用いたNDLOCRアプリの実行方法を共有しました。 nakamura196.hatenablog.com ただし、上記の方法は手続きが一部面倒で、かつ費用がかかる方法です。本番環境で使用するには適した方法ですが、小規模に、または試験的に使用するにはハードルが高い方法でした。 この課題に対して、 @blu…
概要 VMインスタンスの作成 VMインスタンス内での操作 Nvidia driverのインストール dockerコンテナの起動 推論の実行 まとめ 追記 2022.04.28 概要 NDLが公開したNDLOCRアプリケーションについて、GCP(Google Cloud Platform)の仮想マシンを用いて実行してみましたので、その備忘録です。本アプリケーションの詳細については、以下のリポジトリをご確認ください。 https://github.com/ndl-lab/ndlocr_cli VMインスタンスの作成 GCPのCompute Engineにアクセスして、画面上部の「インスタンスを作成…
国立国会図書館「次世代デジタルライブラリー」で公開されているOCR結果をIIIFビューアで閲覧するアプリについて、OCR結果をTEI/XML形式でダウンロードする機能を追加しました。 https://static.ldas.jp/ndl-ocr-iiif/ 本アプリについては、以下の記事も参考にしてください。 https://zenn.dev/nakamura196/articles/d559237570ccf2 本機能の追加にあたり、UIを更新しました。結果を「ビューア」と「データ」に分けています。 「ビューア」については、従来から提供していた「Mirador」と「Curation View…
アクティブに趣味に打ち込めない日のようなので、ぼんやり調べ事。 お題。 今から『繁体字版 天官賜福 通常版』を全巻揃えようと思ったらいくらかかるのか?※天官原作はびーえる作品です。どぎつい表現はありませんが、微かにちらほらほのめかすようになってますので苦手な方はご注意ください。個人的には国内NLより非常にぬるい、初な恋愛レベルと感じますが。感じ方に個人差はあるでしょうから、念のため。これからは日本語版から興味を持つ方も増えるでしょうし。 さて、どこで買えるのか。 1.Amaz○n.jp 2.楽天(の台湾書籍扱ってる店舗) 3.紀伊□屋 実店舗 4.紀伊□屋ウェブストア 5.とある輸入代行 6.…
PASOPIA7を入手しました。またしても、なにもソフトがありませんので、S-OS SWORDを動かします。今回はFDDがありませんので、カセットテープで遊びます。 いつものように最初にイメージを置いておきます。本体だけでなくローダーも必要です。 LOADER.wav - Google ドライブ SWORD.wav - Google ドライブ ソフトもいくつか置いておきます。 ELFES2.wav - Google ドライブ ELFES4.wav - Google ドライブ ソフトの実行に必要な開始アドレス、実行アドレスのメモを置いておきます。 開始アドレス実行アドレス.txt - Googl…
"Geneforge1-Mutagen" Spiderweb Software Inc. 昨日アクセスログを何気なく見たら、突然、普段の20~30倍以上の人がこのブログを訪れていてびっくりした。開設以来、通常はゼロか、来ても数人という過疎ブログだからだ。どうやら、Epicで、Spiderweb Software Inc.の『Geneforge1-Mutagen』が無料開放されたため(2022.07.08.まで)、Googleで「geneforge 日本語化」を検索した結果、ここにたどりつかれたと推察。皆さん、はじめまして。 だが、いきなりこのブログに来ても、内容がニッチすぎて、なに書かれてるか…
2022年7月2日 作成 ■はじめに 本記事では1990年代のF1(フォーミュラ1)の歴代ドライバーチャンピオンのTOP3をまとめてみました。 マシンやタイヤのルールが毎年のように変わる中、各シーズンで活躍したドライバーを見ていきましょう。 ~F1を観るならDAZNがオススメ~ ■1990年シーズン 順位 ドライバー チーム ポイント 1位 アイルトン・セナ マクラーレン 78 2位 アラン・プロスト フェラーリ 71 3位 ネルソン・ピケ ベネトン 43 画像:https://www.flickr.com/photos/smuckatelli/8030617353 アイルトン・セナは前年に続…
お久しぶりです。ケチミンです。 前回の記事で、月1回の更新を目標にすると書いたくせに、めちゃくちゃさぼってしまった…。 まあ何事も気楽に気の向くままにやる主義だからしようがない。 最近までは、研究に没頭できていたように思う。 ほとんど文献ばかり読んでたが。 しかし最近はとにかく暑い。 外を歩くだけでサウナにいるかのように汗が噴き出る。 脇汗シミ上等。こちとら気を遣うほどの意中の異性は周りにおらん。 自宅では冷房をガンガンきかせている(といっても設定温度はチキって28℃)。 夏特有の食欲減退と研究意欲低下(?)が近頃でてきて危ないと思ったため、記事の執筆を試みた次第である。 ↑最近、友人と語り合…
■ソリューション名電子請求書コンカーインボイス ■ソリューション概要請求書を電子化することで、申請、上長承認・会計審査や分析など、予算執行業務における業務を一気通貫してデジタルで管理できるクラウドソリューションです。紙や印鑑での処理の多い予算執行業務。請求書を電子化し、データで管理することで、支出命令書作成のための入力業務や承認業務の負担が大幅に軽減します。また、データを詳しく分析することで、ガバナンス向上や予算執行計画にも役立ちます。さらに、全職員が関わる予算執行業務からDXすることで、DXに対する職員の意識変革にもつながります。●こんなお悩みありませんか?・紙・印鑑による業務をなくしたい・…
両社の提携によって受発注から仕入、会計まで一貫した業務効率化を実現 クロスマート株式会社 2022年7月1日 08時30分 食品流通のDX(デジタルトランスフォーメーション)を推進するクロスマート株式会社(本社:東京都中央区、代表取締役:寺田 佳史、以下「当社」)は、新たに株式会社内田洋行ITソリューションズ(本社:東京都港区、代表取締役社長:新家 俊英、以下「内田洋行ITS」)と7月1日より業務提携契約を締結したことを発表いたします。 クロスマートの運営するLINE※1とFAX-OCRを活用する受発注プラットフォーム「クロスオーダー」と、内田洋行ITSの提供する食品業向けERPパッケージ「ス…
どうもをしるこです。こんにちは。 先月に引き続き、マーセナリーズPVPの月間環境考察を実施していきます。 今月のPVPの結果 2022年6月度(パッチ23.6)のTierランク 先月度と比較したTierリストの要約 現在の編成割合 現環境での主要編成の解説 影編成 サンプルデッキコード 影編成のキー傭兵解説 影編成のラスト1枠 影トークン編成 サンプルデッキコード 影トークン編成のキー傭兵解説 トークン編成の裏 魔力編成 サンプルデッキコード 魔力編成のキー傭兵解説 魔力編成のサブパーツ 魔力編成の初手候補 魔力編成の裏候補 アグロ魔力編成 サンプルデッキコード 凍結編成 サンプルデッキコード…
譲渡証明書とは どんな時に必要な書類? 譲渡証明書の書き方(記入例付き) ①クルマに関する情報の記入欄 ②旧所有者の氏名・住所・実印 ③譲渡の日付 ④新所有者の氏名・住所 譲渡証明書を記入する時の注意点 注意点①手続きは譲渡完了後15日以内に行う クルマの移転登録に必要な書類(※軽自動車を除く) 注意点②用紙の印刷には「普通紙」を利用 注意点③記入ミスをしない 注意点④手続きには委任状が必要なことも多い 譲渡証明書についてよくある質問 Q. 譲渡証明書の様式はどこで手に入る? Q. 軽自動車に譲渡証明書は必要ないの? クルマの購入手続き-関連記事 譲渡証明書とは 譲渡証明書とは、「旧所有者から…
車検証がないと運転も売却もできない 車検証を再発行する方法 自分で再発行申請をする 陸運局や軽自動車検査協会の営業時間 業者に代行で再発行申請を依頼する 再発行手続きに必要なもの 普通自動車の場合 ①申請書 ②理由書 ③手数料納付書 ④車検証 ⑤使用者の委任状 軽自動車の場合 ①申請書 ②発行手数料300円 ③車検証 ④申請依頼書 車検証再発行に関するQ&A Q. 車検証再発行にかかる時間は? Q. 車検証の再発行にはいくらかかる? Q. 車検証を紛失した場合、他に気にするべきことは? Q. 車検切れのクルマを売りたいけど車検証もない。どうすればいい? クルマの手続き関連記事 車検証がないと運…
突然だが、車を買った、ホンダのフリードスパイクという車を。 GWにタントで車中泊旅行をして、もっと快適に車中泊旅行をしたい!という純粋な欲求からだ。3年も乗ったし、軽自動車は物足りなくなってきた。 車中泊にも使える普通車で、ハイエースほど大きくなく、ステップワゴンほどミニバン・大家族向けていうイメージのある車は独り身の自分にはなんとなく合わない気がする。あとバックとかでぶつけるんじゃねという運転スキルの不安が。一度会社のハイエースをぶつけてバックドアやらかしたことあるし。 自分の運転スキルや属性・雰囲気に合う車っていう感じで探すとぴったりなのが「フリードスパイク」だった。他に検討したのは以前乗…
以前、「Windowsでフリーで使えるOCR機能「Google フォト」」という記事を書いた。 この時は、OCR機能を使う方法として、スマホでは「Google レンズ」を使ったが、Windowsでは「Google フォト」を使った。 しかし、Windows版ブラウザChromeでも、「Google レンズ」のOCR機能が使える。「Google フォト」よりも速くて使いやすい。 以下のサンプル画面は、「文春文庫)教科書でおぼえた名文」の中から、夏目漱石の「坊っちゃん」をスキャンしたもの。 スキャンする画像は、以下のように脚注等が付いていると、本文の文字列と混在してしまうので、必要な部分だけを切り…
続きです。 偏差値が10上がった。 正答率が75%。 数学は検索では解けない。 ロジックセオリストで論理的に解く。 数字で計算する場合と、数式のまま計算する場合がある。1/3。 そこそこのアルゴリズムが2000年代に出始めた。 偏差値76.2となった。 放射線画像解析、CT,MRT、人は不足、集中力が低下する過酷なアルバイト。 教師データが多いほど精度が上がる。 今後3年でAIに奪われる。 トレーダーはAIに取って代わられた。 アルゴリズム取引、取引の7割を占める。 答えは融資するか否か、イエスノー、横浜銀行が与信を自動化。 貿易の紙の取引がブロックチェーンで代替。 不動産登記の審査。 税弱へ…
★ ★ ★ ★ ★ ねこたちを病院に連れて行くためのキャリーバッグ。これを持ち上げる音がした瞬間カノン・ジーグに緊張が走る。毎度のことながらこの危険察知能力すごいと思う。今回なんで病院行きなのかというとマイクロチップ入れたのです。全員に。どうしようか悩んでいたのですがやはり災害時などで行方不明になるリスクそれと、かかりつけ病院で今月いっぱいマイクロチップのキャンペーンをやっていて少しだけお安くなっていたようなので思い切ってやってしまおうと思ったわけです。うちのねこども、どいつもこいつもなんの変哲もなくて万が一行方不明になったら見た目の特徴での捜索は厳しいだろうとも思っていたし、賛否両論あると思…
【まだ書きかえます。いつどこを書きかえたかを必ずしも明示しません。】【この記事は個人的おぼえがきです。自分に対するグチと、世間 (とくに Microsoft社) に対するグチをふくみます。しかし、専門知識を提供するものでも、意見を主張するものでもありません。】 - 1 - わたしは、2000年ごろから、(あまり巨大でない) 計算も、文書の読み書きも、1台のノートパソコンでやる習慣ができてしまった。ながらく裁量労働制の研究職で、重大な秘密をあつかうたちばではなかったので、職場でも、自宅でも (自宅がふたつあったときはどちらの自宅でも)、外出さきでも、きれめなく作業をつづけられるとよいと思った。パ…