OCR

このタグでブログを書く

言葉の解説

ネットで話題

OCR

(コンピュータ)

【おーしーあーる】

光学文字認識（Optical Character Recognition）。

イメージスキャナなどで読み取った文書画像を解析し文字データを抽出し、電子テキスト化すること。

類似文字　OCR3→GIANT製の自転車の名称、光学文字認識できる自転車ではない。

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

kaopiz’s diary•3日前

デジタル化による革新：政府業務におけるドキュメントスキャナアプリの役割と利点

デジタル変革の時代において、世界中の政府が業務改善のためにテクノロジーを活用しているのは自然な流れです。事務手続きの簡略化や行列の解消により、より効率的で合理的なアプローチが確立されています。公共サービスのオープン性、アクセシビリティ、迅速性が向上する中で、ドキュメントスキャンアプリは政府にとって欠かせないツールとなっています。政府業務におけるドキュメントスキャナアプリの役割と利点もはや、ファイリングキャビネットに書類が溢れることはありません。政府はプロセスの最新化に迫られ、データ管理を強化し、国民が重要なサービスを利用できるようにする必要があります。書類のデジタル化は、許可、ライセンス、…

#OCR#AI#政府機関#イノベーション

ネットで話題

818ブックマーク画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」

ikubon.com

659ブックマーク PDFの文字をテキスト化！オンラインで簡単に使えるOCRサービス | ライフハッカー・ジャパン

www.lifehacker.jp

640ブックマーク無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね

blog.56doc.net

556ブックマークスマホにカメラついてるんだからOCRできるでしょという気持ち - Progate Tech Blog

tech.prog-8.com

505ブックマーク Google DocsのOCR変換機能が日本語に対応

www.itmedia.co.jp

486ブックマークスクリーンショット＋OCRを実現する『Kleptomania』 - 100SHIKI ～世界のアイデアを日替わりで～

www.100shiki.com

472ブックマーク認識率98.66％？！たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた | Ledge.ai

ledge.ai

375ブックマーク ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています

inouetakuya.hatenablog.com

367ブックマーク秋元@サイボウズラボ・プログラマー・ブログ: reCAPTCHA - キャプチャを利用した人力高性能OCR reCAPTCHA という新サービスはすごい。その構想力には感動させられた。念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっ […] reCAPTCHA という新サービスはすごい。その構想力には感動させられた。念のためにCAPTCHA(キャプチャ)に...

labs.cybozu.co.jp

関連ブログ

Toma（とま）のゲーム日記•16日前

便利アプリ_スマホで撮影してPDFファイルにしよう！WordやExcelファイル化にも一部対応

手書きの資料やパンフレットを電子化して保存しておきたいときがあると思います。そして取り込んだ文章を使いたいときも… そんな時に役立つ、スマホアプリを3つほど集めました。

#スキャン#OCR#スマホアプリ

nikkie-ftnextの日記•2ヶ月前

macOSでTesseractをインストールし、画像内の日本語テキストを検出する

はじめにアーティファクトを最大２つまで対象とし、それらをアンタップする。1 nikkieです。 OCR（光学文字認識）ができるソフトウェア Tesseractの触り出しログです。目次はじめに目次 Tesseract macOSにTesseractをインストール日本語を扱えるようにする画像内の日本語テキストを検出終わりに P.S. 別解：日本語を読めるようにする追記：tessdata_bestのファイルを置くのがオススメ変更履歴 Tesseract Brief historyを見たところ、ヒューレット・パッカード発（1985〜） Googleが開発していた時期がある（2006…

#OCR#OCRエンジン#光学文字認識#Tesseract#Tesseract OCR#macOS#環境構築

kaopiz’s diary•2ヶ月前

ホスピタリティ業界の在庫管理には: AI-OCR

ホスピタリティ業界では、レストラン、カフェテリア、バーの成功と収益性を確保するには、効率的な在庫管理が重要な要素となります。所有者は、製品価格の変動、収縮の管理、期限切れまたは破損した製品による損失の回避などの課題に対処する必要があります。さらに、利用可能な在庫と顧客の需要の間の適切なバランスを維持することが、利益を上げるか経済的損失を被るかの違いを生む可能性があります。 OCR IA ケータリング在庫 (OCR – ホスピタリティにおける在庫管理の向上) のおかげで、受け取った納品書や請求書などの画像またはスキャンされた文書からデータを高精度で自動的にキャプチャできます。この光学ソフト…

#AI#OCR#在庫管理システム#ホスピタリティ

43号線を西へ東へ•2ヶ月前

Windows11の標準機能で、テキスト認識（OCR）をおこなう

Windows11の純正機能でテキスト認識（OCR機能）することが可能です。その方法を備忘録的にまとめます。前回、iPhoneでスクリーンショットや写真からテキストを認識する方法をまとめました。その続きになります。 iPhoneでテキスト認識表示（ライブテキスト）を使いこなす - 43号線を西へ東へ

#Snapping Tool#Windows#テキスト認識#OCR

nikkie-ftnextの日記•2ヶ月前

LLMを使って画像やPDF中のテキストを構造化。知ってる事例まとめ（2024年3月時点）

はじめに（お財布が）試される仕掛け人、nikkieです。テキストを含んだ画像をLLMで扱い、情報を取り出す時に参考にできそうな事例をここに書き出します。目的は知っている事例の整理です。試行錯誤に進むうえで一度書き出します。テキストを含む画像の事例だけでなく、PDFを扱う事例も似ていそうだったので混ぜて扱っています。目次はじめに目次事例1️⃣ 画像をOCRして、テキストを構造化事例2️⃣ PDFから読み取ったテキストの構造化 LLMはテキストの構造化が得意？事例3️⃣ OCRも構造化もGPTで行う例手元にある事例のまとめ🌯 P.S. PydanticのParser 事例1…

#GPT-4#GPT-4V#OCR#JSON#vision API#Document AI

kaopiz’s diary•3ヶ月前

データエントリーの革新: 現代ビジネスにおけるOCR技術の影響

効率的に大量のデータを処理する能力は、ビジネスの成功にとって不可欠です。光学文字認識（OCR）技術はこの点で画期的な進化を遂げ、さまざまな産業で従来のデータエントリープロセスを変革しています。この記事では、OCR技術の進歩、ビジネス界での多様な応用、およびデータ管理と自動化の未来を形作る上でのその重要な役割について掘り下げます。 ※関連記事：OCRは文字をデジタル化する技術現代ビジネスにおけるOCR技術の影響 OCR技術の進化 OCR技術は単なるテキスト認識から、高い精度で複雑な文書を処理できる先進的なシステムへと進化しています。主な進展には以下が含まれます：強化された精度と信頼性: 現代…

#OCR#文字認識#文字起こし#画像文字認識#フォト文字認識#オフショア開発

UUUO Tech Blog•3ヶ月前

OCR/AI を用いた FAX の読み取りによる商品掲載自動化の仕組みづくり

こんにちは！ウーオのソフトウェアエンジニアの髙橋(@yt_hizi)です 👋 今回は OCR/AI のプロダクトへの適用事例について紹介します。 tl; dr 入荷案内の PDF は毎日複数社から届き、これを入力するのに大変な時間がかかる Azure の Document Intelligence を用いて入荷案内情報を OCR で解析し効率化した OCR をプロダクトに組み込む際は、業務に沿った形でデータを変換することがプロダクトの価値になるウーオは日々の入荷案内を全国に届ける市場では日々、さまざまな魚が取引されています。日によって市場にある魚の種類が違えば量も違います。そういった情…

#Rails#Azure#OCR#AI

あきろぐ•3ヶ月前

Google Cloud Vision APIとOpenAIのFunction Callingを使ってみた

今回はGoogleのCloud Vision APIを使って画像からテキストを検出し、そのテキストとOpenAIのFunction Callingを用いて構造化データを抽出していきたいと思います。 Cloud Vision API Googleが提供している画像を分析し情報を抽出できるサービスです。OCRによって画像からテキストを検出したり、ランドマークやロゴなども検出することが可能となっています。 cloud.google.com テキスト検出の場合、最初の1000ユニット（画像）までは無料で使えます。 cloud.google.com OpenAI Function Calling Ope…

#Python#OpenAI#OCR

Notionあれやこれや•3ヶ月前

シンプル操作のOCRスマホアプリを探していたら灯台下暗しだった

OCRはご存じですか。Optical Character Reader/Recognitionの略で、紙やホワイトボードや看板などの画像データからテキスト部分を認識し、テキストデータに変換する光学文字認識機能のことです。

#Notion#OCR#一太郎 Pad#文字認識#iPhone

AITC - ISID | AI トランスフォーメンションセンターコラム•1日前

ASCII×マイクロソフト主催の生成AIコンテスト「AI Challenge Day」に参加してきました！

はじめにこんにちは、AITCの矢作です。この度、4月18日、19日の2日間に神戸の Microsoft AI Co-Innovation Labs で開催されたAI開発コンテスト「AI Challenge Day」に参加してきました。参加メンバーは、AITCから3名、金融事業部から1名、製造事業部から1名の合計5名でした。本記事ではイベントに参加した感想をまとめます。始まったばかりでまだ余裕がある参加者たち AI Challenge Dayとは AI Challenge Dayは、株式会社角川アスキー総合研究所と日本マイクロソフト株式会社が共同で企画したハッカソンイベントで、日本マイ…

岡ブログ•2日前

ミャクミャクナンバーこと万博ナンバーに交換する話

のろまの岡です。先日、ほぼ勢いだけで、関西万博2025のミャクミャクの図柄ナンバー（ミャクミャクナンバー、万博ナンバー）に交換したので、備忘録です。普通のブログなら、構内で辺り構わず顰蹙を買いながら、窓口の写真をふんだんに撮って、これみよがしに載せるのでしょうが、居住地バレ防止のため写真はありません。

LeavaTailの日記•2日前

Linuxカーネルのファイルアクセスの処理を追いかける (23) MMC: mmc_attach_sd

関連記事 Part 1: 環境セットアップ Part 2: System call Interface Part 3: VFS Part 4: ext2 (1) write_iter Part 5: ext2 (2) write_begin Part 6: ext2 (3) get_block Part 7: ext2 (4) write_end Part 8: writeback (1) work Queue Part 9: writeback (2) wb_writeback Part 10: writeback (3) writepages Part 11: writeback (4) …

RECREATION•3日前

私がEvernoteを使い続ける10の理由

昨年末、安価なUpNoteへの移行を検討してましたが、半年使った上で、結局Evernoteに出戻ってきました。一度Evernoteを離れたからこそわかったことがあります。 Evernoteを今後も使う理由について10個書きたいと思います。 1 IFTTTが利用可能 Evernoteは各サービスの連携ができるアプリ、IFTTTに対応しています。ツイートをEvernoteに自動記録してくれるサービスのツイエバは昨年末で終了しましたが、現在でもIFTTTを使えば、同様のことが可能です。その日のツイートやお気に入りにしたツイートを1つのノートにまとめて記録することができます。Swarmのチェック…

『梶村秀樹著作集』完全復刊をめざす会・第6支部［ハンバンパク！！！］•3日前

ハックルベリー＝フィンの冒険（マーク＝トウェイン作、吉田甲子太郎訳）、第４１章とちゅうから第４３章（おわりの章）まで

２０２４０５０８ ■０５―■１４、９分、スキャン、１７枚 ■１８－■２４、６分、、OCR、１７枚合計１５分、 ■４５－■２０、３５分、ざっと整理、３０４－３２７２０２４０５１０ ■４４－■０４、３２７―３３４（余った時間でトムソーヤー上巻の注釈を校正）いったのだよ。それどころか――」「一ダースだって、あんた――四十人かかったところで、あれだけのことを、なにもかも、できやしないよ。あのさやつきのナイフでつくったのこぎりだとか、なんだとか、見てみるがいい、どんなにてまをかけてつくったかしれないよ。あののこぎりでひききった寝台の足だって見てみるがいいぞ。六人で一週間もかかるしごとだ。あの寝台…

晴耕雨読　　　　趣味と生活の覚書•4日前

菅江真澄の旅日記

菅江真澄の旅日記のテキストを校正している。菅江真澄全集十二巻のうち、日記の部分は、第一巻から第四巻までである。数年前に、全集の原文をスキャナーで画像ファイル化して、更にOCRでテキストに変換した。オンラインで、OCR変換してくれるサイトを使ってやったのだが、そのままだと誤変換が多いので、校正作業が必要である。そのまま、放って置いていたので、最近になって、校正作業を再開した。考えてみたら、菅江真澄の文章をテキスト化することを始めたのは、20年以上前のことである。その頃は、スキャナーに付属していたOCRソフトウエアを使って、テキスト化していた。 OCRソフトの変換性能が悪くて、とんでも…

paiza times•5日前

Evernoteはオワコンか？いや、ちょっと待って

＜この記事の著者＞ヨス - Tech Team Journal 業務効率を改善し、タイムパフォーマンスを高める時間最適化の専門家。「単語登録」の便利さを伝える「単語登録エバンジェリスト」。最近はメモアプリとして「Notion」の勢いがすごいように見えます。SNSを見ていると、今まで「Evernote」を使ってきた人もどんどん移行しているように見えますよね。そして「Evernoteはオワコン」という声を聞くこともありますが、それは本当でしょうか？今回は2010年からEvernoteを愛用しているヘビーユーザーのわたしが、現在も使いつづけている理由についてお話しします。【目次】なぜEvern…

『梶村秀樹著作集』完全復刊をめざす会・第6支部［ハンバンパク！！！］•6日前

ハックルベリー＝フィンの冒険（マーク＝トウェイン作、吉田甲子太郎訳）、第３３章とちゅうから第４１章とちゅうまで

２０２４０５０３－２０２４０５０６ ■５７－■１５、１８分、スキャン、３０枚、 ■４５―■５６、１１分、OCR、３０枚 ■５７－■０８、１１分、ざっと整理、３４から３５まで、２１４まで ■３６－■５６、２０分、ざっと整理、３６章まで、２３１まで ■００―■２０、２０分まで、ざっと整理 ■２１―■４１、４０分まで、ざっと整理、３８章まで、２６１まで ■４７―■５９、１２分、スキャン、２０枚、２０３まで ■００－■０６、６分、OCR、２０枚、 ■５８－■２０、２２分、ざっと整理、４０章まで、２９２まで２０２４０５０７ ■５４－■１４、２０分、ざっと整理、４１章まで、３０３まで自分のはじをさらす…

『梶村秀樹著作集』完全復刊をめざす会・第6支部［ハンバンパク！！！］•8日前

ハックルベリー＝フィンの冒険（マーク＝トウェイン作、吉田甲子太郎訳）、第２８章とちゅうから第３３章とちゅうまで

２０２４０５０２－スキャン、３３枚、■０３－■３０、２７分、（スキャンしなおし作業あり） OCR、■４７－■５５、３３枚、８分、スキャン、１７枚、■２０－■３２、１２分 OCR、■３４―■３８、４分 ■００－■２０、２０分、ざっとせいり ■２１―■４１、２０分、ざっとせいり、１３１まで ■４８－■０８、２０分、ざっとせいり、 ■１３―■３３、２０分、ざっとせいり、３２章まで、１７３まで ■５０－■１０、２０分、ざっとせいり、３３章まで、１８９まで ■４５－■０５、２０分、ざっとせいり、２０３までれでもいくらか役にたつかもしれませんがね。ところが、ぼくよりうまくその証明ができる人たちがいる…

ジュナリの森•8日前

【ポケモン剣盾】レイド乱数のseed特定に必要な個体を集める作業を自動化

※2023/8/31追記初めまして、ジュナリと申します。今回はレイド乱数のseed特定に必要な個体を探索、捕獲、ポケモンの情報をログに出力まで自動化したプログラムの説明書をNoteに書いてみました。

nonameのノート•8日前

自炊（電子書籍化）のメリット・デメリットと自炊で使う道具、自炊の方法について

私が感じている自炊（紙の本の電子書籍化）のメリット・デメリットについて書きます。ついでに、使っている道具や自炊の方法もここに記しておきます。私の自炊歴は約半年です。 2023年末から自炊を始めて、紙の本の大半（9割以上）を減らしてきました。自炊のメリットまず、自炊をして良かったと思うことについて書いておきます。 1. 災害に強くなるこれはかなり大きなメリットだと思います。スキャンした本のデータを適切にバックアップすれば、本自体が災害に強くなります。本のスキャンのついでに重要な書類もスキャンしてバックアップすれば家から離れて逃げるときのためらいをいくらか減らせると思います。また、…

『梶村秀樹著作集』完全復刊をめざす会・第6支部［ハンバンパク！！！］•9日前

ハックルベリー＝フィンの冒険（マーク＝トウェイン作、吉田甲子太郎訳）、第２２章から第２８章とちゅうまで

２０２４０４３０注文が来そうにない事がわかって、一日当たりの作業時間を減らしたスキャン、■２０－■３１、２５枚、１１分、 OCR、■３３―■４１、９分２０２４０５０１ ■２８－■４２、１４分、スキャン、０５４－１０３、２５枚 ■４５－■５３、８分、OCR、０５４－１０３、２５枚２０２４０５０２― ■１０－■３０、２０分、ざっとせいり、 ■５４－■１４、２０分、ざっとせいり ■３０－■５０、２０分、ざっとせいり ■５０―■１０、２０分、ざっとせいり、０７３まで ■１１―■２１、１０分、ざっとせいり、０９１まで ■００―■２０、２０分、ざっとせいり、１０３まで、傍点こみ、２８章までもくじ…

sanshonokiの日記•10日前

日能研のスケジュールをOCRで抜き出しGoogleカレンダーに登録する

塾（日能研）の予定表が毎月、印刷物で配られます。あるいは、マイページからpdf形式でダウンロードできます。予定表のサンプルいずれにせよ、それらをカレンダーに手動で登録するのが面倒臭いもう一つ言うと、高学年の予定の日付を確認するためには視線をいちいち左右に振らないといけないので辛いということで、OCRを使ってイベントを抽出し、Googleカレンダーに登録するということをやってみました。 OCRの認識精度（テキスト区切りの安定さも含めて）が完璧ではないので、全自動ではなく半自動のシステムになりますが一応やりたいことはできるようになりました。 github.com 全体の構成 OCRで抽出…

AITC - ISID | AI トランスフォーメンションセンターコラム•10日前

Azure OpenAI Serviceで、GPT-4 Turbo with VisionがGA（一般公開）されました！

GPT-4 Turbo with VisionがGA（一般公開）されました GPT-4 Turbo with Visionは、テキスト生成能力に加えて画像を理解し処理する能力を持っており、多くの分野でその活用が進んでいます。弊社のお客様でもすでに、Know Narrator/ノウナレーター（https://aitc.dentsusoken.com/products/knownarrator.html）で、プレビュー版のGPT-4 Turbo with Vision活用して業務に活用いただいているお客様もいらっしゃいますが、GAによって、より安定的にGPT-4 Turbo with Visio…