llamacpp

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

yousanのメモ•2年前

LLMのrinna/nekomata-14bをGGUFに変換して動かす

はじめに環境開発環境構築 LLMをGGUFに変換 llama.cppの準備モデルのダウンロード GGUFに変換 GGUFを量子化 GGUF化したモデルを動かす llama.cppをGPUで動かす環境を構築 cmakeをインストール CUDA Toolkitをインストール cuBLASを使えるようにする cuBLASを使ってGPU推論最後にはじめにこちらは LLMアドベントカレンダー 23日目です。ここ半年ほど新しく出てきたLLMを動かしたり、他の方が変換されたそのGGUFやAWQを動かしたりして遊んでいました。しかし、自分でも変換くらいできるようになってデプロイまで使用してみよ…

#llamacpp#nekomata#modal#LLM

関連ブログ

LLMのrinna/nekomata-14bをGGUFに変換して動かす

関連ブログ