DocumentIntelligence

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ENGINEERING BLOG ドコモ開発者ブログ•7ヶ月前

Document Intelligenceを活用したPDFのRAGスターターセット

TL;DR Document Intelligenceを使ってPDFをテキストと画像に分離した。テキストと画像を別々のデータとして扱わず、画像のリンクをテキストに組み込んでPDFの文脈を維持するようにした。テキストと画像を用いた簡単なRAGを作成した。自己紹介 NTTドコモデータプラットフォーム部（以下DP部）藤平です。 NTTドコモでは様々なサービスで機械学習やLLMを取り入れることでサービス価値の向上を目指しています。データプラットフォーム部（以下DP部）ではこうした技術の適用を含め、全社におけるデータ活用をミッションとしています。今回執筆いただいた協働者の鶴薗さんとは、DP部…

#DocumentIntelligence#RAG

関連ブログ

Document Intelligenceを活用したPDFのRAGスターターセット

関連ブログ