LLAMA

このタグでブログを書く

言葉の解説

ネットで話題

LLAMA

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ローカルLLM自由帳•1ヶ月前

【LLM論文を読む】DoRA：Weight-Decomposed Low-Rank Adaptation（重み分解LoRA）

ここ数日「Stable Knowledge Editing」を参考にしながら、LoRAファインチューンによるLLMへの知識の追加を試しています。 LoRAのハイパーパラメータ調整のコツを調べるなかで、「DoRA（重み分解LoRA）」という別のLoRA派生手法の存在を知りました。HuggingFaceのPEFTライブラリでも対応しているツールのようです。 DoRA論文は、2024年2月にNVIDIA＆香港科技大学の研究者によりarXivに投稿されています。 arxiv.org 概要広く使われているパラメータ効率的ファインチューニング（PEFT）手法の中で、LoRA（低ランク適応）とその亜種は、…

#LLM#LoRA#ファインチューン

ネットで話題

290ブックマーク無料で商用可、ChatGPT（3.5）に匹敵する生成AI「Llama 2」　Metaが発表、Microsoftと優先連携

www.itmedia.co.jp

274ブックマークラズパイで動く大規模言語モデルがGitHubで公開　性能は“GPT-3相当”、Metaの「LLaMA」派生

www.itmedia.co.jp

220ブックマーク国産の日本語生成AIの無料デモ版が公開～「GPT-3.5 Turbo」に匹敵する性能を達成／東大初のELYZA社が700億パラメーターのLLM「ELYZA-japanese-Llama-2-70b」を開発

forest.watch.impress.co.jp

182ブックマーク Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました｜ELYZA, Inc.

note.com

168ブックマーク Llama

ai.meta.com

119ブックマーク llama font

llamafont.com

98ブックマーク Meta、コード生成や解釈に特化した大規模言語モデル「Code Llama」公開

www.publickey1.jp

83ブックマーク ChatGPT（3.5）に匹敵する「Llama 2」をローカルPCで動かしてみた

www.itmedia.co.jp

80ブックマーク BEGIN{ require Llama } #書評_ - 初めてのPerl 第6版 : 404 Blog Not Found

dankogai.livedoor.blog

関連ブログ

ローカルLLM自由帳•3ヶ月前

【LLM論文を読む】RAG vs ファインチューニング

2024/1/16にMicrosoftから「RAG vs ファインチューニング：パイプライン、トレードオフ、農業におけるケーススタディ」というarxiv論文が出てました。特定領域に固有の知識（この論文では農業関連データ）をLLMアプリケーションの回答に取り入れる手法として、RAGと微調整を比較検討した研究のようです。 arxiv.org 概要（機械翻訳）大規模言語モデル（LLM）のアプリケーションを構築する際、開発者が独自のデータやドメイン固有のデータを取り入れる一般的な方法が2つある：それは、RAG（Retrieval-Augmented Generation）と微調整（Fine-Tu…

#RAG#ローカルLLM#ファインチューニング

ハオのガジェット工房•9ヶ月前

【気になるNEWS】Snapdragon 8 gen 2にMeta社製AI Llama2を標準搭載か！？

Sorce : qualcomm.com Qualcomm社が、同社の主力製品であるSnapdragon シリーズにMeta社が手掛けるAl「Llama２」を2024年から搭載すると発表しました。同社によると、このAIを使用するためにインターネットに接続する必要はなく、オフラインでも使用できるとのことです。Meta社は「Llama」をすでにオープンソース化していることも発表しました。非常に興味をひかれたニュースなので、簡単に情報をまとめてみました。「Llama２」とは？ Snapdragonに搭載されて何ができる？いつ搭載されるのか？ (News Sorce) www.androidaut…

#Snapdragon#LLAMA#AI

エンジニアですよ！•2年前

Log Structured Storageを重ねて使うと起きる問題とLLAMAについて調べたことまとめ

Database Internalsを読んでて、7章の最後 Log Stacking のところで疑問が多くていろいろ調べていたなかのひとつ。 HSEとは何か - Speaker Deck LLAMAの話ではないけど同じような話としてこの↑資料が良かったのでこれを見よう。 Log Structured Storageを重ねて使うと起こる問題ファイルシステムもSSDもLog Structuringを利用していて、昨今Log Structured Storageを利用するアプリケーションも増えてきていて、たくさんの階層でログが使われている。そうするといろいろと不都合があって、その不都合については本…

#database internals#log structured storage#LSS#LLAMA#Database

DT10mmAUTOの日記•3年前

【考察：物語と銃】～～theEDGE～　　第3話　⑩頑住吉プレッシンピストルを・・・撃つッ！

さて・・・と ( ・∀・)ニヤニヤでは一通り作動の方法もレビューしたので動画行きますかー。とはいえこれは弾の出ないモデルガンそのため発砲はありませんが、 LlamaPressin の動画自体が非常にレアたぶん日本語でこの銃を動画にしているもの好きは私くらいのモノではないでしょうか？ (;´･ω･) まぢですか・・・というわけで、恐らく世界初日本語によるLlamaPressinのレビュー動画です。どぞ ( ・ω・)ノ www.youtube.com BB弾を発砲できるモデルではないので、計測や派手な銃声やアクションはありませんが、どうですか？ワタシ、theEDGE…

#LLAMA#モデルガン#エアガン#電動ガン#ガスガン#サバゲー　＃usp　＃電動ハンドガン　＃ジャンク

DT10mmAUTOの日記•3年前

【考察：物語と銃】~theEDGE~　　第3話　⑨頑住吉　プレッシンピストルを・・・見るッ！

開封した・・・ (;´･ω･) それでは幻のモデルガン頑住吉プレッシンピストルのレビューをいたします。 ■外観■ これは少ない文献の中でも概ね触れられている通り「ホチキス」みたいな形状です。全長も12㎝程度と、確かにデスクのホチキスを連想しますね。 ■刻印■ フレーム右側には「CAL32」の刻印前出記事にも記載しましたが、 32ACP（7.65×17㎜）ではなく専用弾（7.65×15㎜）だそうです。ケースが2㎜短く、中の装薬も32ACPの量より少ないらしい。続いて左側の刻印はこうなっているプレッシンピストルの製造メーカーである Llama社（リャマ）はスペインの企…

#LLAMA#モデルガン#エアガン#ガスガン#電動ガン#サバゲー装備#サバゲー

ソフトウェア開発者のための OSS、まとめてみました！•1年前

デジタルマーケティングに重点を置いたデータサイエンス手法について知りたいなら！「awesome-marketing-datascience」

概要突然ですが、みなさんはデジタルマーケティングというワードをご存じでしょうか？デジタルマーケティングとは、インターネットや IT 技術などのデジタル技術をかつようしたマーケディング手法になります。インターネットが現代のように世の中に浸透するまでは、営業さんが家庭や企業などに個別に訪問し、売込みだったりアンケート調査などをベースにしたマーケティングが主流でした。しかしインターネットが登場したことにより、Web サイトへのアクセス分析や個人へのメールによるマーケティングに取って代わりました。さらに現代では Web・メールだけでなく、リアル店舗での行動だったり購買活動をビッグデータや A…

#OSS#awesome-marketing-datascience#デジタルマーケティング#ウェブ分析#Power BI#データサイエンス#Awesome

Vengineerの戯言•13時間前

YURINGのLLM ASIC開発用巨大FPGAボードの準備

はじめに TURINGがAMD(Xilinx)の巨大なFPGA評価ボードを購入しましたね。ということを4月3日に書きました。 vengineer.hatenablog.com 今回は、その巨大なFPGA評価ボードの準備として、Kria KV260 を使ったという下記のTuring の Tech Blog について記録に残します。言語モデルを高位合成でFPGAに実装してみた FPGAによるLLM推論 : Swan FPGAに実装したのは、llama2.c を参考に、Transformerとその本質的な演算だけをFPGA用に実装した swan のようです。 github.com この gith…

NTNX＞日記•21時間前

AI/ML を動かすなら Nutanix で GPT-in-a-Box？（登壇資料）

先日の Nutanix Meetup Hybrid 24.04 にて、GPT-in-a-Box と、GitHub で公開されているドキュメント、デモアプリについて紹介しました。その際の発表資料です。 nutanix.connpass.com 今回の内容です。当日の録画 GPT-in-a-Box 入門 GPT-in-a-Box のドキュメント GPT-in-a-Box のデモアプリ GPU と Nutanix HCI デモアプリ利用までの様子（VM を使うパターン）参考： GPU-Operator のインストール方法おまけ

盆暗の学習記録•21時間前

Phi-3をCPUのみで動かしてみる（ローカル / AWS Lambda）

スマホでも動くくらい高速だと謳われているMicrosoftの小規模言語モデルPhi-3を要約と和訳について試してみました。環境・前提モデル環境コード要約させてみる推論時間日本語に翻訳させてみる Lambdaでの生成速度まとめ環境・前提モデル 4bit量子化モデルを使用します huggingface.co 環境以下のDocker Imageを使います FROM python:3.11 RUN pip install llama-cpp-python また、ローカルPCのスペックは以下の通りです。 OS: WSL Ubuntu 20.04 CPU: i7-10700K コード…

CLOVER🍀•1日前

QdrantのExampleから、「基本的なRAG（Basic RAG）」を試す

これは、なにをしたくて書いたもの？今までQdrantのチュートリアルを試してきたのですが、今度はExampleを見てみようと思います。 Examples - Qdrant ただ、Exampleで見るのは「基本的なRAG（Basic RAG）」のみにしたいと思います。それから、Qdrant自体を集中的に扱うのもここで区切りにしようかなと。今回のExampleの狙いこのExampleでは、Qdrant＋Fastembed、OpenAIを使ってRAGを構成する例を示します。ところでExampleは「Examples」ページにリストアップされている内容から、実際のページに移るとタイトルが大幅…

NTT Communications Engineers' Blog•2日前

Databricks Container ServiceでTensorRT-LLMを動かしてみた

本記事ではDatabricksのDatabricks Container Serviceを用いてNVIDIA社の推論ライブラリであるTensorRT-LLMを実行可能なNotebook環境を構築する方法を紹介します。目次目次はじめに Databricks Container Service NVIDIA TensorRT-LLM 解決したいこと TensorRT-LLM Container Imageの作成 Databricks Containers ベースイメージの変更 Pytorch バージョンの変更 TensorRT-LLMのインストール動作確認 Databricks環境設定 T…

CLOVER🍀•3日前

Metaの「Llama 3」をOpenAI API互換のサーバーを持つllama-cpp-pythonとLocalAIで試す

これは、なにをしたくて書いたもの？ MetaからLlama 3がリリースされました。 Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に - ITmedia NEWS このLlama 3をOpenAI API互換のサーバーを持つllama-cpp-pythonおよびLocalAIで動かせそうなので、試してみることにしました。 Llama 3 Llama 3はMetaの公開しているLLMです。 Meta Llama 3 Introducing Meta Llama 3: The most capable openly available LLM to dat…

シンギュラリティ実験ノート•3日前

Llama3（70B）をGroqのLPUで動かしてみた

Janの最新バージョンv0.4.12が本日リリースされた。Llama3とCommand R+をサポートするようになったらしい。ダウンロードしてみたところ、GroqでLlama3の70Bが使えるようになっていた。GroqはOpenAIのようにAPIを通してサービスを提供しており、LPU（Language Processing Unit）というLLMを爆速で動かすLLM推論専用ハードを開発している会社だ。 Llama3の70B（700億パラメタ）はサイズが40GB以上あるので、我が家のLAN環境ではダウンロードするだけで数時間かかる。ここは手っ取り早くJanのAPI機能を使って動かしてみることにし…

クックパッド開発者ブログ•3日前

NLP2024 に参加しました

こんにちは！技術部機械学習グループの山口 (@altescy) です。先月、神戸にて開催された言語処理学会第30回年次大会 (NLP2024)に同じく機械学習グループの深澤 (@fufufukakaka)と共に参加してきました。昨年に引き続き今年も過去最多の参加者数となり、言語処理研究の盛り上がりを実感しました。特に去年の年次大会 (NLP2023) のタイミングで GPT-4 が発表されて以降、自然言語処理の研究は大きな転換期を迎えていると感じます。大規模言語モデル (LLM) が研究の主流となる中、どんな課題や発見があるのか、期待をもって参加する大会となりました。この記事では …

norio shimizu blog•4日前

DAY2024/04/25の気になった技術ブログ一覧

本日の気になった技術ブログ Tips リンク集です。 [Unity]metaファイル追加のコミット漏れをGit Hooksで検知【Unity】「UnityEngine.dll」を使用した DLL の作成方法 AUTO_INCREMENTで正しくインクリメントされない複数IEnumerableのZip関数 Brother TD-4750TNWBR RFIDタグへの書込とラベル印刷を両方行う Mind8のディスパッチャ実装MCodePointerの謎に迫る（Cのtype unionの代替実装をC#で行う） [Android] Arm64でAnti-Disassembly/Decompile 【…

ローカルLLM自由帳•4日前

ファインチューニングの終焉：全ては継続的な事前学習

少し古いですが「ファインチューニングの終焉（The End of Fine-tuning）」という記事が面白かったので、簡単なメモです。 www.latent.space この記事に登場するFast.aiのJeremy Howardさんは「事前学習→追加学習→RLHF」のように、フェーズごとにデータセットの種類・手法を完全に切り替えていく言語モデルの学習方法は「もはや正しくない」と主張しています。「私は今では誰もが採用している 3 段階の学習アプローチを最初に考案しましたが、これは実は間違っており、使用すべきではないというのが私の今の見解です。正しい方法は、ファインチューニングという考えを捨…

シュガーのファンタイム•4日前

ベーシックインカムの祈り感想レビュー著者：井上真偽小説集英社文庫

この記事にはプロモーションが含まれています。ランキング参加中読書ようこそ、シュガーです。集英社文庫から発売されている小説著者：井上真偽さんベーシックインカムの祈りを読みました! ベーシックインカムの祈り (集英社文庫) 作者:井上真偽集英社 Amazon 井上真偽さんのファンなので手に取った本です! 面白かったです。感想、レビューを書いて行きます。いつも通り個人的な評価です。多少のネタバレが含まれると思いますのでご注意ください。では行きましょう! ベーシックインカムの祈り内容紹介ストーリーあらすじ感想レビュー評価井上真偽さん作品感想レビュー記事まとめア…

シンギュラリティ実験ノート•4日前

LM StudioでLlama3（8B）を動かしてみた

1000ドルPCでLlama3を動かしてみた。LM Studioのv0.2.20からLlama3がサポートされている。この最新バージョンにしたところ、内蔵GPUの780MでLLMを動かすことができることも分かったのでその点についても簡単にまとめておきたい。 LM Studio for Windows のGPUサポート Windows版ではAVX2対応のCPUをサポート対象としている。LM StudioのダウンロードページにはAMD ROCm対応版もプレビュー版として公開されている。AMD ROCm対応版はLinux版かと思いきや、Windows版で提供されている。 LM Studio ダウンロ…

ローカルLLM自由帳•6日前

【LLM論文を読む＆試す】LLMの刈り込み(Pruning)：深いレイヤーの不合理な非効率性

先日「Llama-3-70Bを刈り込み（Pruning）で42Bに縮めたモデルが登場」というRedditの投稿が話題になっていました。投稿者はおなじみのkindacognizant（kalomaze）さんですが、モデル作成者は別の方のようです。モデルのHuggFaceのRepoはこちら。 huggingface.co このモデルを実際に触ってみましたが、InstructモデルではなくBaseモデルを刈り込んだものなので正直なところ良し悪しはよくわかりませんでした。投稿によれば、Pruned-Llama3のMMLUスコアは76-77（4bitでテスト）で、元の79から若干低下しているものの、…

エキサイト TechBlog.•6日前

Spring AI に入門する

エキサイト株式会社エンジニアの佐々木です。詳細は話せませんがAI系の業務が発生したので、技術選定の一環でSpring AIを触ってみました。前提手順 1. Spring CLI をインストールする 2. Spring CLIでAI用のプロジェクトを作成する 3. OpenAIのAPIキーを取得します 4. 環境変数にAPIキーをセットします 5. SpringBootを起動します 6. リクエストしてみる内部実装ライブラリコード Spring AIで使用できる一覧まとめさいごに前提 $ java --version openjdk 17.0.10 2024-01-16 LTS …

関連ブログ

【LLM論文を読む】DoRA：Weight-Decomposed Low-Rank Adaptation（重み分解LoRA）

ネットで話題

関連ブログ

【LLM論文を読む】RAG vs ファインチューニング

【気になるNEWS】Snapdragon 8 gen 2にMeta社製AI Llama2を標準搭載か！？

Log Structured Storageを重ねて使うと起きる問題とLLAMAについて調べたことまとめ

【考察：物語と銃】～～theEDGE～ 第3話 ⑩頑住吉プレッシンピストルを・・・撃つッ！

【考察：物語と銃】~theEDGE~ 第3話 ⑨頑住吉 プレッシンピストルを・・・見るッ！

デジタルマーケティングに重点を置いたデータサイエンス手法について知りたいなら！「awesome-marketing-datascience」

YURINGのLLM ASIC開発用巨大FPGAボードの準備

AI/ML を動かすなら Nutanix で GPT-in-a-Box？（登壇資料）

Phi-3をCPUのみで動かしてみる（ローカル / AWS Lambda）

QdrantのExampleから、「基本的なRAG（Basic RAG）」を試す

Databricks Container ServiceでTensorRT-LLMを動かしてみた

Metaの「Llama 3」をOpenAI API互換のサーバーを持つllama-cpp-pythonとLocalAIで試す

Llama3（70B）をGroqのLPUで動かしてみた

NLP2024 に参加しました

DAY2024/04/25の気になった技術ブログ一覧

ファインチューニングの終焉：全ては継続的な事前学習

ベーシックインカムの祈り 感想 レビュー 著者：井上真偽 小説 集英社文庫

LM StudioでLlama3（8B）を動かしてみた

【LLM論文を読む＆試す】LLMの刈り込み(Pruning)：深いレイヤーの不合理な非効率性

Spring AI に入門する

【考察：物語と銃】～～theEDGE～　　第3話　⑩頑住吉プレッシンピストルを・・・撃つッ！

【考察：物語と銃】~theEDGE~　　第3話　⑨頑住吉　プレッシンピストルを・・・見るッ！

ベーシックインカムの祈り感想レビュー著者：井上真偽小説集英社文庫