光学文字認識(Optical Character Recognition)。
イメージスキャナなどで読み取った文書画像を解析し文字データを抽出し、電子テキスト化すること。
類似文字 OCR3→GIANT製の自転車の名称、光学文字認識できる自転車ではない。
会議の議事録作成は、ビジネスパーソンにとって避けては通れない、しかし非常に工数のかかる作業です。 これまでは「PCを開いて腰を据えて作成するもの」という認識が一般的でしたが、近年のAI技術の進化により、その常識が大きく変わりつつあります。 実際のデータに目を向けると、検索市場ではデスクトップに比べ、モバイルからのクリック数が約2倍に達しており、外出先や移動中の「隙間時間」にAIを活用したいというニーズが急速に高まっています。 (出典:2026年5月度キーワード予測データより) 本記事では、エンジニアとしての視点から、「スマホ1台で音声文字起こしから資料のOCR(文字認識)まで完結させる」ための…
MiniSnip v1.1 日本語化 MiniSnipは、シンプルで軽量なスクリーンショットツールです。画面上の任意の範囲を素早く選択して画像として保存したり、クリップボードへコピーしたりできます。また、選択した範囲の文字をOCRで読み取る機能も備えており、画像内のテキストを簡単に取得できます。余計な機能を省いたコンパクトな設計で、素早く画面を切り取りたいときに便利なツールです。 - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - ⬇️…
NDLOCR-Liteでフォルダを指定することで複数のファイルを連続でテキスト化してみる。 ncos1.hatenablog.com ここのサンプルで試してみる。 www.mojigori.com OCRボタンを押すと連続で変換される。 細かい手書き文字はやはり誤認識されてしまうみたい。 変換例 このサンプルでも間違うなら、自分の文メモでは全く使えないと思う( ノД`)シクシク… こちらは正確に変換できた。 ”出力形式の選択” 設定で、出力する形式を複数選択できる。 無料で使えるし、アップデートも継続しているので今後にも期待(^^)
毎日体重を測定し、Xで報告をして記録をExcelで残していますが、これが結構めんどくさい。というわけでアプリを作って簡単にできないかと、計画をスタートしました。 Google製のAI:Geminiを使って作成していきます。 初心者なのでアプリの作成完了までたどり着けるのかは…わかりません。
NDLOCR-Liteは軽量な日本語OCRです。colabで試してみたらいい感じでした。REST APIとして実装してみました。APIができたので、いろんなプログラムから呼べるので便利です。 bwgift.hatenadiary.jp `/v1/ocr` で同期処理に加え、非同期処理もサポート。負荷テストも簡単に実施しました。落ちたりしませんでした。 APIを簡単にテストできるようにstreamlitによるUIを実装しました。画像をupload出来るほか、オリジナルのレポジトリのテスト用画像データを利用することも出来るようにしました。 色々と使い手がありそうです。 github.com 公開し…
国立国会図書館がOCRアプリを無償公開されているようなので、インストールしてみたくなった。 GPU不要をアピールしているが、AIで手書き文字を認識している?該当のページにはっきりとは書いていない気がするが?Webの情報を見るとAIで手書き文字などを認識しているみたい。 pc.watch.impress.co.jp NDLラボのページを確認。 lab.ndl.go.jp Gitの公開ページ github.com Windows用は1.0.2が最新。 Linuxなら1.0.3が利用できる。 ndlocr_lite_v1.0.2_windows.zip 207 MB をダウンロード。 解凍してウィル…
GLM-OCRが軽快で日本語もいけるのでいつでも使えるようにしてみたメモ 導入 ollamaをインストール (Windows版、exeファイル) モデル検索してglm-ocrを入れる。適当にメッセージを打ってロードしておく。(初回から画像入れるとvision対応してないとか言われるけど対応している) open-webuiを導入 python -m venv venv_openwebui venv_openwebui\Scripts\activate.bat pip install open-webui open-webui.exe serve --port 18080 あれ、なんか導入ずいぶん…
2026年1月27日、「IBM Elite Support for Docling」の一般提供(GA: General Availability)について発表がありました。 community.ibm.com これだけ見るとDoclingは有料になっちゃうの?🤔と感じますが、そうでは無いようです。 この発表の意味するところや企業がDoclingを活用する上での選択肢がどのように広がったのか書いてみようと思います。 Doclingとは Doclingは、IBM Researchが開発したオープンソースのドキュメント処理ツールです。PDF、Word、PowerPointなどの非構造化ドキュメントを…
私は、仕事で会社の事務全般を見ている感じなのですが、その中で、ずっーと変わらないものがあります。 画像の電卓なのですが、縦18cm、横13cmの大型のサイズで、時代が変わりつつもこの電卓を使用しています。事務処理的にある程度の大きさがないと操作・見やすさが仕事に影響する為です。 AI、DX、PCの進化などありますが、現状この電卓が手放せない感じでいます。今後は、もう少し進化してくれれば、もっと変わるかもしれないなぁって思ったりしますが、まだ少し時間が掛かりそうですかね? ランキング参加中雑談・日記を書きたい人のグループ ランキング参加中雑談 ランキング参加中アクセスの輪