Night Landing Practiceの略で、米海軍の航空母艦艦載機が夜間における航空母艦着艦技術向上の為に行う夜間離着陸訓練のこと。 陸上の飛行場の滑走路を航空母艦の甲板に見立てて行われるタッチ・アンド・ゴー(touch and go)訓練で、艦載機を滑走路に着陸*1させた後、直ちに再離陸するという訓練でこれを繰り返し何セットも行う。これが夜間に行われる。 厚木基地、横田基地、岩国基地、三沢基地などでは夜間に近隣住民へ与える航空機騒音が社会問題となっている。
*1:着陸といっても車輪を滑走路に接触させる程度のもの
Nonlinear programming。非線形計画法。最適化問題の一つ。
→自然言語処理 (Natural Language Processing)
http://www.dma.aoba.sendai.jp/~acchan/Seminar/neurolin-draft.html (神経言語プログラミング/NLPの真実)
→神経言語プログラミング
こんにちは、エンジニアの渡辺(@mochi_neko_7)です。 今回は Rust で VectorDB を触ってみる話をします。 VectorDB は機械学習の文脈で使われることが多いため Python のサポートをしているものが多い一方で、Rust で直接触れるものが本当に少ないです。 なぜわざわざ Rust で使用したいのかの背景もお話ししつつ、Rust で触れる VectorDB である Qdrant、 追加で必要になる Sentence Embeddings など実装する上で考慮すべきポイントもサンプルコードを交えながら紹介します。 かなりニッチなテーマになりますが LLM の文脈で…
前回はHugging FaceのTransgormersとLangChainを用いたテキスト生成を実装しました。 今回はさらにChromaを用いて、ローカルのDB上のデータを参照して質問応答を行うテキスト生成を実装してみます。 ChromaはいわゆるベクトルDBの一種です。 ベクトルDBは埋め込みベクトルのような高次元のベクトルデータを扱うのに適したDBです。 ベクトルDBの実装には色々とありますが、今回はサーバを構築しなくても簡単に試せるChromaを使ってみました。 このベクトルDBと大規模言語モデル(LLM: Large Language Model)を用いたテキスト生成を組み合わせるこ…
前回は Hugging FaceのTransgormers Pipelineを用いたテキスト生成を実装しました。 今回はTransgormers Pipelineに加えてLangChainも使用したテキスト生成を実装してみます。 LangChain を利用すると大規模言語モデルを用いたアプリケーション開発が容易になります。 モデルやデータベース、データの取り込みなどが抽象化されており、統一されたインターフェースを用いて実装できます。 このLangChainとHugging Faceで公開されている学習済み大規模言語モデルを使えば、精度はさておき、無料でChatGPTライクなものが実装できるので…
皆さんこんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。この記事は「Prompt Flowを使ってRAGの回答を自動評価する」記事の続きの記事になります。 acro-engineer.hatenablog.com 前回記事では、Azure Machine Learning Prompt Flowを使って手動で回答を評価することはできたので、今回はファイルから複数回答の自動評価を検証してみます。目次 おさらい 一括テストを使っ…
皆さんこんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。Microsoft Buildを経て、AzureにもGPTを利用したサービスが数多く発表されており、LLMをサービスとして利用できる使い方増えていてワクワクしますね。 今回と次回の記事を通して、その中のサービスの一つであるAzure Machine Learning Prompt Flowというサービスを使ってRAG(Retrieval Augmented Genera…
Hugging Face の Transformers には推論を簡単に行うための Pipeline という仕組みがあります。 PyTorch や TensorFlow のような面倒なコードを書かずに、わずかなコーディング量で推論することができるので、ちょっとしたことを試すのにはとでも便利です。 Pipeline 自体は画像認識や音声認識など様々なタスクに使用できるようですが、今回は自然言語処理のタスク、特にテキスト生成を試してみます。 特定のモデルで Pipeline を使用する流れはこんな感じです。 学習済みモデルをロード タスクやモデルなどを指定して Pipeline を構築 推論の実行…
「精緻化見込みモデル」(Fine-Grained Projection Model)とは、自然言語処理(NLP)の分野で使用される手法の一つです。このモデルは、テキスト生成や文章の補完などのタスクにおいて、より詳細で精緻な予測や生成を行うことを目的としています。 通常の言語モデルでは、文の次の単語を予測するために、一般的な文脈を考慮します。しかし、文脈をより細かく解析し、文内の構文的な関係や意味的なつながりを捉えるためには、より精緻なモデルが必要です。 精緻化見込みモデルでは、文脈をより詳細に考慮するために、文内の構文的な関係や意味的なつながりをモデル化します。これにより、より正確な予測や生成…
はじめに ISID AITCに所属しております、ファイサルです。本記事では、Azure OpenAIサービスを活用して、社内の質問応答(QA)システムを構築してみました。この記事では、構築手順や結果について簡潔にご紹介いたします。 背景と目的 最近話題になったChatGPTは、その優れた性能が注目を集めていますが、いくつかの制約も存在します。その中でも特に重要なのは、Hallucination(幻覚症状)という課題です。ChatGPTは、与えられた文脈や情報から推測を行い、存在しない情報を誤って生成することがあります。つまり、モデルが事実ではない情報を答えたり、根拠のない主張をしたりすることが…
こんにちは! AI製品開発チームの太田です。 2023年6月6日から開催されている人工知能学会全国大会2023にて、8日に私が発表した内容について紹介します。 説明可能なAIの判断根拠を、意思決定の支援に活用している方も多いと思います。 今回、判断根拠の不確実性を文書分類モデルの精度改善に活用しました。 この提案手法を利用するお客様は、システムが提示する文章データのハイライト部分を編集する簡単な作業だけで精度改善が見込めます。 本手法はAITCで開発している製品への搭載に向け検証を継続していく予定です。 研究内容の概要 提案手法の全体像 詳しく知りたい方はこちらの発表資料をご確認ください。 s…
「アイ・アクセシング・キュー(Eye Accessing Cues)」は、神経言語プログラミング(NLP)という心理学的手法で使用される概念です。この理論によれば、人が思考や情報処理を行う際に、目の動きや視線の方向が特定の意味を持つとされています。具体的には、人が特定の思考プロセスや情報へのアクセスをする際に、目の動きや視線の方向が示唆されるとされています。例えば、右目を使って上方を見るときは視覚的なイメージを思い出すことが多く、左目を使って上方を見るときは内部の音声を再生することが多いとされています。また、右目を使って右方を見るときは自分自身の内部で行われる内省的な思考が関与し、左目を使って…
タイトル: Transformers versus LSTMs for electronic trading https://arxiv.org/pdf/2309.11400.pdf この論文の内容を簡単に説明します。 著者: Paul Bilokon, Yitao Qiu 概要: この研究では、金融の時系列予測において、LSTM(Long Short-Term Memory)とTransformerという二つの異なる人工知能モデルの性能を比較しています。LSTMは、これまで金融の時系列予測で広く使用されてきました。一方で、Transformerは自然言語処理(NLP)で成功を収めており、時系…
NumpyはPythonで数値計算を行うためのライブラリであり、データ分析や機械学習、自然言語処理(NLP)などに広く利用されています。この記事では、Numpyを用いて自然言語処理の基本的な操作を実行する方法について解説します。 目次 はじめに テキストデータの読み込みと前処理 単語のトークン化 単語のベクトル化:One-hot Encoding 単語頻度によるフィルタリング:TF-IDF コサイン類似度による文章間の類似度計算 まとめ 1. はじめに import numpy as np import re from sklearn.feature_extraction.text impor…
はじめに 本書は苫米地英人博士に科学から仏教、洗脳のことから心のあり方まで、ありとあらゆることを聞きまくった知の究極本となります。 なぜ、知の究極本となるのかと言えば、苫米地博士の天才ぶりが凄まじいからです。 ともかくなにを聞いても即座に答えてくれるだけでなく、その答えが異常なまでに面白いのです。 ──博士、四次元ってなんですか? 苫米地 それは待ち合わせだよ(笑)。 一体どういうことかと思うのですが、説明を受けると、たちどころに納得! 文系だらけの私たち編集陣にも理解できる科学的解説で、いままでどんな大学の先生に聞いてもいまひとつピンとこなかったものが一気に氷解するのです。 はっきり言って、…
現代のテクノロジーの進化により、私たちの生活はますますデジタル化され、コミュニケーションはオンラインで行われることが一般的になってきています。 その中で、最近注目されているのが自然言語処理(NLP)です。NLPは、人間の言語をコンピューターが理解し、処理するための技術です。 その進歩により、音声アシスタントやチャットボットとのやり取りが容易になりました。この記事では、「ChatGPT」に焦点を当て、その仕組みや機能、実際の利用例について紹介していきます。 これだけは押さえておきたい生成系AI用語 生成系AIの用語説明 類似用語の整理 「大規模言語モデル(LLM)」と「自然言語処理(NLP)」と…
ただ今ジモティーで実験をしています YouTubeの占いで言われた 私の “ ヒーリング能力 ” を検証しているのです 知らない方とビデオなしzoomで30分お話をして どう感じたか感想をいただいています (๑´ლ`๑)ウフフッ 今のところ5人の方とお話をしました みなさんいい人だったので、優しい感想をいただきました 『印象は一言で言うと、元気をもらえる 元気と言っても、活力がみなぎるとかではなく 無理に励ましや慰めの言葉などなくても ただ会話をしているだけで 話す前より何だかちょっと元気になっている これは、技術やテクニックではなく あなたの元来の性質によるものだと思います』 と言われました…
大層なタイトルを掲げてしまいました。 今のプロジェクト・現場は9月までとなりました。元々9月が工程の区切りでは有ったのですが、自分の勤怠状況が良くないことを理由に一足先に確定しました。他の方々はもう少し続くようです。10月以降なにをするのかよくわかりませんが・・・ そうなると4月から一緒に作業してきたオールドルーキーさんも分かれることになります。本当はとにかく1年、彼が独り立ちできるよう頑張ろうと考えてしまいました。しかし半年で終わってしまいます。最近の彼の仕事ぶりを見ていて、ルーキーとしてはとても活躍していますが、「わかっていない」ことが沢山ある、伝えてきたつもりだけどまだ伝わっていないと感…
英語のテックブログや技術ドキュメントなんかを訳していると、「Fortunately」 や「The good news is ~」という表現によく遭遇します。 これらの表現に対してよく使われる訳が「幸い」。 英辞郎や Linguee なんかで訳例を見ると大抵「幸い」と訳されているんですけど、他の翻訳者の過去訳を見ても「幸い」が多いのですけど。 でも、日本人が書いたテックブログや技術ドキュメントで「幸い」を使う頻度はとっても低くありませんか? (日本語の「幸い」は英語の「Fortunately」 や「The good news is ~」よりも主観的な響きがあって、客観性が求められる文章では使われ…
はじめに ヤバいよ、マジヤバいよ1。nikkieです。 9月のみんなのPython勉強会のレポートです。 クラウドがテーマの回だったのですが、(スタッフ)参加後の私の脳内は「Hugging Faceがヤバい... ヤバいよ...」となってました 目次 はじめに 目次 勉強会の概要 Postmanで始めるAI・機械学習プラットフォームHugging Face 強化学習基礎の基礎とAWS DeepRacerはじめの一歩 LT「ChatGPT in SlackでAI Slackbotを楽しく運用する」 拙LT「Pythonイベントインフォメーション(9月版)」 終わりに P.S. 紹介された書籍 勉…
はじめに ファインチューニング、ばーっといってみよー! nikkieです えぬえるぴーやな素振り記事です。 チュートリアルに沿ってtransformersを使ってコーディングしました 目次 はじめに 目次 transformersのToken Classificationチュートリアル 動作環境 チュートリアルでの学び 単語で分割済みのデータセットのトークナイズ 単語単位の正解ラベルとのアラインメント Trainerインスタンスの初期化 終わりに transformersのToken Classificationチュートリアル こちらです。 Colabで開くリンクはこちら1 https://c…
/* スポンサーロゴ */ table { border-collapse: collapse; border-spacing: 0; } table.photo { width: 100%; table-layout: fixed; } table.photo td { font-size: 13pt; text-align: center; vertical-align: middle; white-space: normal; word-break: break-all; padding: 5px 5px; border: 0; width: 50%; color: black; } 2…
第1条(名称) この団体の名称はNLP若手の会運営委員会(英語名:the Young Researcher Association for NLP Studies,略称「YANS」,以下「本会」という)とする. 第2条(所在地) この団体を次の所在地に置く. 奈良県生駒市 第3条(目的) 本会は自然言語処理およびその関連分野の若手研究者の交流を促進することにより,自然言語処理およびその関連分野の進歩・発展・普及をはかることを目的とする. 第4条(活動) 第3条の目的を達するため,本会は原則として年1回以上のシンポジウムを開催する.また,研究者相互の交流のため,ウェブページ等を運営する. 第5条…
本電子書籍を示すサムネイルなどのイメージ画像は、再ダウンロード時に予告なく変更される場合があります。 本電子書籍は縦書きでレイアウトされています。 また、ご覧になるリーディングシステムにより、表示の差が認められることがあります。 本文中に「*」が付されている箇所には注釈があります。その箇所を選択すると、該当する注釈が表示されます。 はじめに 9割の人は「誰かの」人生を生きている あなたにお会いするのをずっと待っていました。 数多くある書籍の中で、本書を手に取っていただきありがとうございます。 この本を手に取っていただいたあなたは、 「いつも悩みがモヤモヤして不安でつらい……」 「誰かの目が気に…
生成系AI(ジェネレーティブAI)とは 画像・動画・オーディオ生成 VAE(アルゴリズム) GAN(アルゴリズム) Diffusionモデル(アルゴリズム) その他、未分類等 テキスト生成 Transformer(アルゴリズム) 総合サービス Google Amazon 生成系AI(ジェネレーティブAI)とは 生成系AI(ジェネレーティブAI)とは、新しいオリジナルのアウトプットを生み出すAIのこと。大きくは下記パターンに分類できます。 画像や動画 オーディオ(音声や音楽など) テキスト(文章やコードなど) 世界的なブームで、サービスが多く混乱するため、生成系AIで展開されているサービス・モデ…
本ブログでは、YANS2023に参加し、発表もしたので体験談を書きます。 ブログ自体書くことも初めてなので書けるか心配でありますが・・・ 本ブログの構成 そもそもNLP若手の会YANSって? 実際に参加し、発表してみて どういったひとにおすすめか そもそもNLP若手の会(YANS)って? NLP若手の会は,自然言語処理,計算言語学および関連分野の,若手研究者および技術者の学問研究および技術開発の促進をはかり,参加者の相互交流および成長の場を提供し,培われた学問研究および技術開発の成果が実社会に応用されることを奨励し,この分野の学問および産業の進歩発展に貢献することを目的として,年に1度,研究シ…
ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 現在は、週に1回程度の頻度で、社内で実施している生成AI・LLMに関する論文レビュー会の内容をピックアップのうえ配信しています。 今回は、LLMの性能改善に関連して、4つの論文をご紹介させていただきます。 論文選定基準 From Pretraining Data to Language Models to Downstream Tasks:Tracking the Trails …