こんにちは。 ノバセルにてデータサイエンティストをしています、石川ナディーム(@nadeemishikawa)です。 本記事ではOpenAI APIの「Image inputs対応モデル」と「Structured Outputs」を組み合わせ、1 回の API 呼び出しで「画像 → 指定構造の構造化データ(JSON/Pydantic)」まで完結させる方法を紹介します。 はじめに ビジネスシーンでは、請求書や名刺など、画像形式の非構造化データを扱う機会が、何かと数多く存在しています。今までは、これらの画像からテキスト情報を抽出するためにはOCR(光学的文字認識)が主に用いられてきましたが、いくつ…