はじめに (お財布が)試される仕掛け人、nikkieです。 テキストを含んだ画像をLLMで扱い、情報を取り出す時に参考にできそうな事例をここに書き出します。 目的は知っている事例の整理です。 試行錯誤に進むうえで一度書き出します。 テキストを含む画像の事例だけでなく、PDFを扱う事例も似ていそうだったので混ぜて扱っています。 目次 はじめに 目次 事例1️⃣ 画像をOCRして、テキストを構造化 事例2️⃣ PDFから読み取ったテキストの構造化 LLMはテキストの構造化が得意? 事例3️⃣ OCRも構造化もGPTで行う例 手元にある事例のまとめ🌯 P.S. PydanticのParser 事例1…