こんにちは。電通総研 金融ソリューション事業部の若本です。 今回は、RAG内部で使用するベクトル検索の設定のチューニングについての記事になります。 RAGとは ベクトル検索になぜチューニングが必要なのか? 近似近傍探索 実験 検索対象 検索クエリ 評価方法 結果 おわりに RAGとは RAG(Retrieval-Augmented Generation)は、ユーザーのクエリに対して外部の知識を検索し、それをもとにChatGPTのような大規模言語モデル(LLM: Large Language Model)に回答を生成させる手法になります。 具体的な方法は山下さんの記事でも紹介されていますので、興…
はじめに スケルツォ見てスッキリ。nikkieです。 OpenAIから2024年1月のアップデートが来ましたね。 その中の目玉と思われるembedding新モデルのAPIで少しだけ手を動かしました 目次 はじめに 目次 OpenAI embedding新モデルのAPI APIでembeddingを得て、テキストの類似度計算 英語の例(text-embedding-3-small) 日本語の例(text-embedding-3-small) text-embedding-3-large(日本語) text-embedding-3-large(日本語)でdimensionsを指定する 積ん読資料た…
スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); diffusersでembeddingを使えるようになっていたので、試してみました この記事は導入の備忘録です 目次 目次 この記事でわかること 1.実行環境 2.コード 参考 スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); この記事でわかること diffuserrsでembeddingを導入する方法 1.実行環境 Google Colab Diffusers:0.15.0 transformers:4.…
はじめに こんにちは、バイセル23卒エンジニアの臼井です。 今回はChatGPTに社内の情報を答えてもらうために、テキストのEmbedding APIを使用して、社内情報をRAGで扱う方法について紹介します。 社内の情報には画像データなど、テキスト以外のデータもありますので、それらをどのようにしてEmbeddingするかが論点となります。 対象読者は、自前のデータをChatGPTなどのLLMに組み込みたいと考えている開発者です。 特に、多様なデータ形式(テキスト、画像、スライドなど)を組み込みたい方の参考になれば幸いです。 はじめに 背景 Fine-tuningとRAG その他使用した技術 課…
これは、なにをしたくて書いたもの? 今までQdrantのチュートリアルを試してきたのですが、今度はExampleを見てみようと思います。 Examples - Qdrant ただ、Exampleで見るのは「基本的なRAG(Basic RAG)」のみにしたいと思います。それから、Qdrant自体を集中的に扱うのもここで 区切りにしようかなと。 今回のExampleの狙い このExampleでは、Qdrant+Fastembed、OpenAIを使ってRAGを構成する例を示します。 ところでExampleは「Examples」ページにリストアップされている内容から、実際のページに移るとタイトルが大幅…
こんにちは! 技術部機械学習グループの山口 (@altescy) です。 先月、神戸にて開催された言語処理学会第30回年次大会 (NLP2024)に同じく機械学習グループの深澤 (@fufufukakaka)と共に参加してきました。 昨年に引き続き今年も過去最多の参加者数となり、言語処理研究の盛り上がりを実感しました。 特に去年の年次大会 (NLP2023) のタイミングで GPT-4 が発表されて以降、自然言語処理の研究は大きな転換期を迎えていると感じます。 大規模言語モデル (LLM) が研究の主流となる中、どんな課題や発見があるのか、期待をもって参加する大会となりました。 この記事では …
最近起こったこと、やっていることなどを共有したい 転職活動について 今年の1月から転職活動を始めている。転職活動を始めた理由は複数あるが、いろいろ書いていこうと思う。なお、2024-04-24現在のステータスは「振出しに戻った」である。 ダークサイド まずはネガティブな理由から Web広告・ダークサイド 今いる会社はWeb広告系の会社なのだけど、Web広告業界そのものに嫌気がさした。 端的に言って、Web広告は以下の二つのうちいずれかである: 無課金ユーザーに対するペナルティ ×(バツ)ボタンを押せないユーザーに対する嫌がらせ 自分のやっている仕事を職場外の友人に話したときの感想は大体似たよう…
こんにちは、開発部モバイルアプリチームの小関です。 普段は求人飲食店ドットコムのiOS・Androidアプリの開発をしている私ですが、昨年4月に設立された「GPTプロジェクトチーム」にも参加しており、この1年でより一般的にも身近になってきた生成AIをサービスや普段の業務に使えないかと模索する仕事もする日々です。 今回は、そんな「GPTプロジェクト」の一環で作成した社内アシスタントBotによって、ナレッジの検索しづらさを解決しようとした事例をご紹介しようと思います。 GPTプロジェクトとは 弊社では2023年4月から、CTO直下に「GPTプロジェクトチーム」を新設して(*1)、ChatGPTのよ…
こんにちは。Algomatic の宮脇(@catshun_)です。 本記事では文書検索において一部注目された BGE M3-Embedding について簡単に紹介します。 Chen+'24 - BGE M3-Embedding: Multi-Lingual, Multi-Functionality, Multi-Granularity Text Embeddings Through Self-Knowledge Distillation
エキサイト株式会社エンジニアの佐々木です。詳細は話せませんがAI系の業務が発生したので、技術選定の一環でSpring AIを触ってみました。 前提 手順 1. Spring CLI をインストールする 2. Spring CLIでAI用のプロジェクトを作成する 3. OpenAIのAPIキーを取得します 4. 環境変数にAPIキーをセットします 5. SpringBootを起動します 6. リクエストしてみる 内部実装 ライブラリ コード Spring AIで使用できる一覧 まとめ さいごに 前提 $ java --version openjdk 17.0.10 2024-01-16 LTS …
目的 OpenAI のサービスについて、いつ何がローンチされたのか?など、どうしても忘れてしまうのでここにまとめていく ちなみに、時折サービスとは違うトピックも挟もうと思う おそらく、このページは長くなる 目次 目的 目次 過去の関連記事 Frontier Model Forum の立ち上げ at 2023-07-26 コンテントモデレーションに GPT-4 API を活用 at 2023-08-15 Global Illumination 社を買収 at 2023-08-16 GPT-3.5 Turbo の Fine-tuning が利用可能になった at 2023-08-22 ChatGP…
結果左側の写真から右側の写真を作成しました。 PC環境 Windows 11 CUDA 11.8 Python 3.11Python環境構築 pip install torch==2.2.2+cu118 --index-url https://download.pytorch.org/whl/cu118 pip install git+https://github.com/huggingface/diffusers pip install accelerate transformers peft pip install onnxruntime-gpu insightfacePythonスクリプ…
Transformerの原典である"Attention Is All You Need" の論文要約メモです。 はじめに Attention Is All You Need 概要 手法 モデルアーキテクチャ 学習方法 結果 翻訳タスク Transformerモデルバリエーション 英語構文解析 おわりに/所感 参考 はじめに かの有名なAttention Is All You Need、原典をちゃんと読んだことなかったので読みます。 arxiv.org 2017/06/12にv1公開 Google Brain / Google Research コード: tensor2tensor/tensor…
G-gen の神谷です。本記事では、BigQuery の機能を使って、商品を意味&ランキング検索できる ChatBot を作ってみたので、そのご紹介ができればと思います。 アプリの概要 ユースケース 背景とメリット アーキテクチャ システムアーキテクチャ RAG テーブル設計 検索処理の詳細 使っている技術と実装例 BigQuery ML のテキストエンべディング関数 BigQuery リモート関数用のコネクションオブジェクト作成 Vertex AI API を BigQuery のリモート関数として登録 テキストデータからエンベディングベクトルの抽出 BigQuery ML の類似ベクトル検…
Building a RAG Pattern chat bot with Azure OpenAI and LangChain.js | Azure Developers JavaScript Day Azure 技術資料インデックス AWS 初学者向けの勉強方法 6 ステップ!2024 年版! 【論文要約】Jamba: A Hybrid Transformer-Mamba Language Model【メモ】 サイバーエージェントが生成AI活用で「6割の業務削減」を宣言 独自開発中の「AIナスカ」が一翼を担う ナレッジグラフ(知識グラフ)とLLMを掛け合わせる方法のロードマップ Google…
スペクトルデータの2次元化が機械学習モデルの性能を向上させる理由 入力データの次元性 機械学習モデル、特に畳み込みニューラルネットワーク(CNN)は、一般に2次元または3次元の入力データを扱うように設計されています。1次元のデータを直接CNNに入力すると、空間的な局所相関を捉えにくくなります。そのため、1次元のスペクトルデータを適切に高次元化する必要があります。 2次元化による利点 1次元のスペクトルデータを2次元に変換すると、以下の利点が得られます。 空間的局所相関の保持 スペクトルデータには、隣接する波長間で相関がある可能性が高いです。2次元化によってこの局所相関が保持され、CNNがこの情…
google cloud のセマンティック検索を使ってみたい 詳しい内容は google cloud の 動画から www.youtube.com テキスト検索ではなく、ベクトル検索になるので、いい感じで検索結果をかえしてくれるらしい また、マルチモーダルのため画像、音声なども扱える。 今回は 画像を google cloud storage に置き、セマンティック検索を試してみたい。 まずは、画像データの準備から 機械学習の無料のサンプルデータセットを利用した。 ここには 30枚の部屋の写真がのっている。 それぞれ、雰囲気や映しているものも異なる。 ローカルに一度保存。 cloud stor…
こんにちは、Algomatic LLM STUDIO インターンのなべ(@_h0jicha)です。 前回の記事では、LLM の日本語性能を評価するための様々なベンチマークを紹介しました。 tech.algomatic.jp しかし、こうしたベンチマークには以下のような課題が存在します。 ベンチマークの導入に負担がかかってしまうため、もっと 気軽に評価したい 既存のベンチマークによる評価が難しく独自実装が必要なとき、あらかじめ基本的な機能が搭載されている評価ツールを利用したい LLM の評価とともに、LLM を使用する際の プロンプトの評価も同時に行いたい そこで本記事では、LLM の出力品質を…
こんにちは、CCCMKホールディングス TECH LABの三浦です。 最近とあるゲームの自宅専用のサーバーを立てる、ということにチャレンジしてみました。作業は想像よりも複雑ではなくて調べながら進めて上手く稼働させることが出来ました。難しそうだな、と思っていたこともいざやってみるとそんなに難しくなかった、ということは結構あります。今年度は色々なことにチャレンジしてみたいな、と思いました。 前回LangChainのLangGraphというライブラリを使って簡単なLLM Agentアプリケーションを構築してみた話をご紹介しました。 techblog.cccmkhd.co.jp 前回はAgentに2つ…