光学文字認識(Optical Character Recognition)。
イメージスキャナなどで読み取った文書画像を解析し文字データを抽出し、電子テキスト化すること。
類似文字 OCR3→GIANT製の自転車の名称、光学文字認識できる自転車ではない。
デジタル変革の時代において、世界中の政府が業務改善のためにテクノロジーを活用しているのは自然な流れです。事務手続きの簡略化や行列の解消により、より効率的で合理的なアプローチが確立されています。公共サービスのオープン性、アクセシビリティ、迅速性が向上する中で、ドキュメントスキャンアプリは政府にとって欠かせないツールとなっています。 政府業務におけるドキュメントスキャナアプリの役割と利点 もはや、ファイリングキャビネットに書類が溢れることはありません。政府はプロセスの最新化に迫られ、データ管理を強化し、国民が重要なサービスを利用できるようにする必要があります。書類のデジタル化は、許可、ライセンス、…
手書きの資料やパンフレットを電子化して保存しておきたいときがあると思います。 そして取り込んだ文章を使いたいときも… そんな時に役立つ、スマホアプリを3つほど集めました。
はじめに アーティファクトを最大2つまで対象とし、それらをアンタップする。1 nikkieです。 OCR(光学文字認識)ができるソフトウェア Tesseractの触り出しログです。 目次 はじめに 目次 Tesseract macOSにTesseractをインストール 日本語を扱えるようにする 画像内の日本語テキストを検出 終わりに P.S. 別解:日本語を読めるようにする 追記:tessdata_bestのファイルを置くのがオススメ 変更履歴 Tesseract Brief historyを見たところ、 ヒューレット・パッカード発(1985〜) Googleが開発していた時期がある(2006…
ホスピタリティ業界では、レストラン、カフェテリア、バーの成功と収益性を確保するには、効率的な在庫管理が重要な要素となります。 所有者は、製品価格の変動、収縮の管理、期限切れまたは破損した製品による損失の回避などの課題に対処する必要があります。 さらに、利用可能な在庫と顧客の需要の間の適切なバランスを維持することが、利益を上げるか経済的損失を被るかの違いを生む可能性があります。 OCR IA ケータリング在庫 (OCR – ホスピタリティにおける在庫管理の向上) のおかげで、受け取った納品書や請求書などの画像またはスキャンされた文書からデータを高精度で自動的にキャプチャできます。 この光学ソフト…
Windows11の純正機能でテキスト認識(OCR機能)することが可能です。その方法を備忘録的にまとめます。 前回、iPhoneでスクリーンショットや写真からテキストを認識する方法をまとめました。その続きになります。 iPhoneでテキスト認識表示(ライブテキスト)を使いこなす - 43号線を西へ東へ
はじめに (お財布が)試される仕掛け人、nikkieです。 テキストを含んだ画像をLLMで扱い、情報を取り出す時に参考にできそうな事例をここに書き出します。 目的は知っている事例の整理です。 試行錯誤に進むうえで一度書き出します。 テキストを含む画像の事例だけでなく、PDFを扱う事例も似ていそうだったので混ぜて扱っています。 目次 はじめに 目次 事例1️⃣ 画像をOCRして、テキストを構造化 事例2️⃣ PDFから読み取ったテキストの構造化 LLMはテキストの構造化が得意? 事例3️⃣ OCRも構造化もGPTで行う例 手元にある事例のまとめ🌯 P.S. PydanticのParser 事例1…
効率的に大量のデータを処理する能力は、ビジネスの成功にとって不可欠です。光学文字認識(OCR)技術はこの点で画期的な進化を遂げ、さまざまな産業で従来のデータエントリープロセスを変革しています。この記事では、OCR技術の進歩、ビジネス界での多様な応用、およびデータ管理と自動化の未来を形作る上でのその重要な役割について掘り下げます。 ※関連記事:OCRは文字をデジタル化する技術 現代ビジネスにおけるOCR技術の影響 OCR技術の進化 OCR技術は単なるテキスト認識から、高い精度で複雑な文書を処理できる先進的なシステムへと進化しています。主な進展には以下が含まれます: 強化された精度と信頼性: 現代…
こんにちは! ウーオのソフトウェアエンジニアの髙橋(@yt_hizi)です 👋 今回は OCR/AI のプロダクトへの適用事例について紹介します。 tl; dr 入荷案内の PDF は毎日複数社から届き、これを入力するのに大変な時間がかかる Azure の Document Intelligence を用いて入荷案内情報を OCR で解析し効率化した OCR をプロダクトに組み込む際は、業務に沿った形でデータを変換することがプロダクトの価値になる ウーオは日々の入荷案内を全国に届ける 市場では日々、さまざまな魚が取引されています。日によって市場にある魚の種類が違えば量も違います。 そういった情…
今回はGoogleのCloud Vision APIを使って画像からテキストを検出し、そのテキストとOpenAIのFunction Callingを用いて構造化データを抽出していきたいと思います。 Cloud Vision API Googleが提供している画像を分析し情報を抽出できるサービスです。OCRによって画像からテキストを検出したり、ランドマークやロゴなども検出することが可能となっています。 cloud.google.com テキスト検出の場合、最初の1000ユニット(画像)までは無料で使えます。 cloud.google.com OpenAI Function Calling Ope…
OCRはご存じですか。Optical Character Reader/Recognitionの略で、紙やホワイトボードや看板などの画像データからテキスト部分を認識し、テキストデータに変換する光学文字認識機能のことです。
はじめに こんにちは、AITCの矢作です。 この度、4月18日、19日の2日間に神戸の Microsoft AI Co-Innovation Labs で開催されたAI開発コンテスト「AI Challenge Day」に参加してきました。 参加メンバーは、AITCから3名、金融事業部から1名、製造事業部から1名の合計5名でした。 本記事ではイベントに参加した感想をまとめます。 始まったばかりでまだ余裕がある参加者たち AI Challenge Dayとは AI Challenge Dayは、株式会社角川アスキー総合研究所と日本マイクロソフト株式会社が共同で企画したハッカソンイベントで、日本マイ…
のろまの岡です。 先日、ほぼ勢いだけで、関西万博2025のミャクミャクの図柄ナンバー(ミャクミャクナンバー、万博ナンバー)に交換したので、備忘録です。 普通のブログなら、構内で辺り構わず顰蹙を買いながら、窓口の写真をふんだんに撮って、これみよがしに載せるのでしょうが、居住地バレ防止のため写真はありません。
関連記事 Part 1: 環境セットアップ Part 2: System call Interface Part 3: VFS Part 4: ext2 (1) write_iter Part 5: ext2 (2) write_begin Part 6: ext2 (3) get_block Part 7: ext2 (4) write_end Part 8: writeback (1) work Queue Part 9: writeback (2) wb_writeback Part 10: writeback (3) writepages Part 11: writeback (4) …
昨年末、安価なUpNoteへの移行を検討してましたが、半年使った上で、結局Evernoteに出戻ってきました。 一度Evernoteを離れたからこそわかったことがあります。 Evernoteを今後も使う理由について10個書きたいと思います。 1 IFTTTが利用可能 Evernoteは各サービスの連携ができるアプリ、IFTTTに対応しています。 ツイートをEvernoteに自動記録してくれるサービスのツイエバは昨年末で終了しましたが、現在でもIFTTTを使えば、同様のことが可能です。 その日のツイートやお気に入りにしたツイートを1つのノートにまとめて記録することができます。Swarmのチェック…
20240508 ■05―■14、9分、スキャン、17枚 ■18-■24、6分、、OCR、17枚 合計15分、 ■45-■20、35分、ざっと整理、304-327 20240510 ■44-■04、327―334(余った時間でトムソーヤー上巻の注釈を校正) いったのだよ。それどころか――」 「一ダースだって、あんた――四十人かかったところで、あれだけのことを、なにもかも、できやしないよ。あのさやつきのナイフでつくったのこぎりだとか、なんだとか、見てみるがいい、どんなにてまをかけてつくったかしれないよ。あののこぎりでひききった寝台の足だって見てみるがいいぞ。六人で一週間もかかるしごとだ。あの寝台…
菅江真澄の旅日記のテキストを校正している。 菅江真澄全集十二巻のうち、日記の部分は、第一巻から第四巻までである。 数年前に、全集の原文をスキャナーで画像ファイル化して、更にOCRでテキストに変換した。 オンラインで、OCR変換してくれるサイトを使ってやったのだが、そのままだと誤変換が多いので、校正作業が必要である。 そのまま、放って置いていたので、最近になって、校正作業を再開した。 考えてみたら、菅江真澄の文章をテキスト化することを始めたのは、20年以上前のことである。 その頃は、スキャナーに付属していたOCRソフトウエアを使って、テキスト化していた。 OCRソフトの変換性能が悪くて、とんでも…
<この記事の著者> ヨス - Tech Team Journal 業務効率を改善し、タイムパフォーマンスを高める時間最適化の専門家。「単語登録」の便利さを伝える「単語登録エバンジェリスト」。 最近はメモアプリとして「Notion」の勢いがすごいように見えます。SNSを見ていると、今まで「Evernote」を使ってきた人もどんどん移行しているように見えますよね。そして「Evernoteはオワコン」という声を聞くこともありますが、それは本当でしょうか?今回は2010年からEvernoteを愛用しているヘビーユーザーのわたしが、現在も使いつづけている理由についてお話しします。【目次】 なぜEvern…
20240503-20240506 ■57-■15、18分、スキャン、30枚、 ■45―■56、11分、OCR、30枚 ■57-■08、11分、ざっと整理、34から35まで、214まで ■36-■56、20分、ざっと整理、36章まで、231まで ■00―■20、20分まで、ざっと整理 ■21―■41、40分まで、ざっと整理、38章まで、261まで ■47―■59、12分、スキャン、20枚、203まで ■00-■06、6分、OCR、20枚、 ■58-■20、22分、ざっと整理、40章まで、292まで 20240507 ■54-■14、20分、ざっと整理、41章まで、303まで 自分のはじをさらす…
20240502- スキャン、33枚、■03-■30、27分、(スキャンしなおし作業あり) OCR、■47-■55、33枚、8分、 スキャン、17枚、■20-■32、12分 OCR、■34―■38、4分 ■00-■20、20分、ざっとせいり ■21―■41、20分、ざっとせいり、131まで ■48-■08、20分、ざっとせいり、 ■13―■33、20分、ざっとせいり、32章まで、173まで ■50-■10、20分、ざっとせいり、33章まで、189まで ■45-■05、20分、ざっとせいり、203まで れでもいくらか役にたつかもしれませんがね。ところが、ぼくよりうまくその証明ができる人たちがいる…
※2023/8/31追記初めまして、ジュナリと申します。今回はレイド乱数のseed特定に必要な個体を探索、捕獲、ポケモンの情報をログに出力まで自動化したプログラムの説明書をNoteに書いてみました。
私が感じている自炊(紙の本の電子書籍化)のメリット・デメリットについて書きます。 ついでに、使っている道具や自炊の方法もここに記しておきます。 私の自炊歴は約半年です。 2023年末から自炊を始めて、紙の本の大半(9割以上)を減らしてきました。 自炊のメリット まず、自炊をして良かったと思うことについて書いておきます。 1. 災害に強くなる これはかなり大きなメリットだと思います。 スキャンした本のデータを適切にバックアップすれば、本自体が災害に強くなります。 本のスキャンのついでに重要な書類もスキャンしてバックアップすれば家から離れて逃げるときのためらいをいくらか減らせると思います。 また、…
20240430 注文が来そうにない事がわかって、一日当たりの作業時間を減らした スキャン、■20-■31、25枚、11分、 OCR、■33―■41、9分 20240501 ■28-■42、14分、スキャン、054-103、25枚 ■45-■53、8分、OCR、054-103、25枚 20240502― ■10-■30、20分、ざっとせいり、 ■54-■14、20分、ざっとせいり ■30-■50、20分、ざっとせいり ■50―■10、20分、ざっとせいり、073まで ■11―■21、10分、ざっとせいり、091まで ■00―■20、20分、ざっとせいり、103まで、傍点こみ、28章まで もくじ…
塾(日能研)の予定表が毎月、印刷物で配られます。 あるいは、マイページからpdf形式でダウンロードできます。 予定表のサンプル いずれにせよ、それらをカレンダーに手動で登録するのが面倒臭い もう一つ言うと、高学年の予定の日付を確認するためには視線をいちいち左右に振らないといけないので辛い ということで、OCRを使ってイベントを抽出し、Googleカレンダーに登録するということをやってみました。 OCRの認識精度(テキスト区切りの安定さも含めて)が完璧ではないので、全自動ではなく半自動のシステムになりますが一応やりたいことはできるようになりました。 github.com 全体の構成 OCRで抽出…
GPT-4 Turbo with VisionがGA(一般公開)されました GPT-4 Turbo with Visionは、テキスト生成能力に加えて画像を理解し処理する能力を持っており、多くの分野でその活用が進んでいます。 弊社のお客様でもすでに、Know Narrator/ノウナレーター(https://aitc.dentsusoken.com/products/knownarrator.html)で、プレビュー版のGPT-4 Turbo with Vision活用して業務に活用いただいているお客様もいらっしゃいますが、GAによって、より安定的にGPT-4 Turbo with Visio…