光学文字認識(Optical Character Recognition)。
イメージスキャナなどで読み取った文書画像を解析し文字データを抽出し、電子テキスト化すること。
類似文字 OCR3→GIANT製の自転車の名称、光学文字認識できる自転車ではない。
娘が4月から幼稚園に通い始めました。🌸 園からは予定表、給食献立、同意書、感染症対応などのプリントが紙で届くのですが、後から知りたくなるのは文書そのものではなく、「明日の持ち物は何か」「この病気にかかったらどう対応すべきか」といった断片的な情報です。 紙のまま管理すると、必要な情報にたどり着くのが手間になると感じ、自然言語で検索する形にできないかを考えていました。 そこで、LINE を入口にして、Notion に整理した情報を Cloud Run 上のアプリケーション経由で検索できる、小規模な文書検索システムを試作しました。 こういった類の課題解決をするための商用サービスはいくつかありますが、…
AdobeAcrobatは高機能で便利ですが、その分サブスク料金が気になってしまうという声もよく聞きます😅そこで最近注目されているのが、Adobeの代替として使える買い切りPDF編集ソフトです。 一度購入すれば継続課金なしで使えるため、コストを抑えながらPDF編集・変換・結合・OCRなどの機能をしっかり活用できるのが魅力📄✨「必要なときだけ使いたい」「できるだけ固定費を減らしたい」という人にとって、かなり現実的な選択肢になっています。 Part1. Adobeの代替として使える買い切りPDFソフトが選ばれる3つの理由 Part2. Adobeの代替として注目される買い切りPDFソフト「PDNo…
開発日誌の2回目です。 今回は「スキャンしたPDFの文字をテキストとして取り出す機能」を作っている話をします。 --- 紙をスキャンしてPDFにしたとき、見た目は普通のPDFなのに文字をコピーできない、という経験はありませんか? あれは「画像としてのPDF」だからで、文字を認識させるには OCR(光学文字認識)という処理が必要です。 世の中にはクラウド型のOCRサービスがたくさんありますが、たとえば確定申告の書類や契約書をクラウドに送るのって、ちょっと怖くないですか? --- なのでHiyoko PDF Vaultでは、**Macの中だけで完結するOCR**を実装することにしました。 実はMa…
会議の議事録作成は、ビジネスパーソンにとって避けては通れない、しかし非常に工数のかかる作業です。 これまでは「PCを開いて腰を据えて作成するもの」という認識が一般的でしたが、近年のAI技術の進化により、その常識が大きく変わりつつあります。 実際のデータに目を向けると、検索市場ではデスクトップに比べ、モバイルからのクリック数が約2倍に達しており、外出先や移動中の「隙間時間」にAIを活用したいというニーズが急速に高まっています。 (出典:2026年5月度キーワード予測データより) 本記事では、エンジニアとしての視点から、「スマホ1台で音声文字起こしから資料のOCR(文字認識)まで完結させる」ための…
MiniSnip v1.1 日本語化 MiniSnipは、シンプルで軽量なスクリーンショットツールです。画面上の任意の範囲を素早く選択して画像として保存したり、クリップボードへコピーしたりできます。また、選択した範囲の文字をOCRで読み取る機能も備えており、画像内のテキストを簡単に取得できます。余計な機能を省いたコンパクトな設計で、素早く画面を切り取りたいときに便利なツールです。 - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - = - ⬇️…
NDLOCR-Liteでフォルダを指定することで複数のファイルを連続でテキスト化してみる。 ncos1.hatenablog.com ここのサンプルで試してみる。 www.mojigori.com OCRボタンを押すと連続で変換される。 細かい手書き文字はやはり誤認識されてしまうみたい。 変換例 このサンプルでも間違うなら、自分の文メモでは全く使えないと思う( ノД`)シクシク… こちらは正確に変換できた。 ”出力形式の選択” 設定で、出力する形式を複数選択できる。 無料で使えるし、アップデートも継続しているので今後にも期待(^^)
毎日体重を測定し、Xで報告をして記録をExcelで残していますが、これが結構めんどくさい。というわけでアプリを作って簡単にできないかと、計画をスタートしました。 Google製のAI:Geminiを使って作成していきます。 初心者なのでアプリの作成完了までたどり着けるのかは…わかりません。
NDLOCR-Liteは軽量な日本語OCRです。colabで試してみたらいい感じでした。REST APIとして実装してみました。APIができたので、いろんなプログラムから呼べるので便利です。 bwgift.hatenadiary.jp `/v1/ocr` で同期処理に加え、非同期処理もサポート。負荷テストも簡単に実施しました。落ちたりしませんでした。 APIを簡単にテストできるようにstreamlitによるUIを実装しました。画像をupload出来るほか、オリジナルのレポジトリのテスト用画像データを利用することも出来るようにしました。 色々と使い手がありそうです。 github.com 公開し…
国立国会図書館がOCRアプリを無償公開されているようなので、インストールしてみたくなった。 GPU不要をアピールしているが、AIで手書き文字を認識している?該当のページにはっきりとは書いていない気がするが?Webの情報を見るとAIで手書き文字などを認識しているみたい。 pc.watch.impress.co.jp NDLラボのページを確認。 lab.ndl.go.jp Gitの公開ページ github.com Windows用は1.0.2が最新。 Linuxなら1.0.3が利用できる。 ndlocr_lite_v1.0.2_windows.zip 207 MB をダウンロード。 解凍してウィル…