GGUFとは?

読み方: ジージーユーエフ

30秒まとめ

llama.cppで使用されるAIモデルのファイルフォーマット。ローカルLLM実行の標準形式。

GGUFの意味・定義

GGUF(GPT-Generated Unified Format)は、llama.cppプロジェクトで使用されるAIモデルのファイルフォーマットです。以前のGGML形式の後継として開発され、モデルの重み、トークナイザー情報、メタデータなどを一つのファイルに格納します。CPUでの推論に最適化されており、GPUがなくても一般的なPCでLLMを実行できる点が最大の特徴です。量子化されたモデルの配布形式としても広く使われており、Q4_K_M、Q5_K_Mなど様々な量子化レベルを選択できます。Ollamaはバックエンドでllama.cppを使用しており、GGUF形式のモデルを手軽に実行できます。Hugging Faceには多数のGGUF形式のモデルが公開されており、Meta LLaMA、Mistral、Gemmaなどの主要なオープンソースモデルがGGUF形式で利用可能です。ローカルLLM実行のデファクトスタンダードとなっています。

関連するAIツール

関連する用語

運営者が開発したAIマーケティングツール