Gemma 3 4Bローカル推論モデル - オープンソースで無料のGGUF量子化バージョンが利用可能です

ホーム

Gemma 3 4b It Q4 K M GGUF

Aldarisによって開発

Gemma 3 4BモデルのGGUF量子化バージョンで、ローカル推論に適しています。

大規模言語モデル

Transformers

#軽量推論 #多輪対話 #知識問答

ダウンロード数 190

リリース時間 : 3/14/2025

モデル概要

これはgoogle/gemma-3-4b-itモデルのGGUF形式に変換されたバージョンで、主にテキスト生成タスクに使用されます。

モデル特徴

GGUF形式

量子化されたモデル形式で、ローカルデバイスで効率的に動作します。

ローカル推論

llama.cppを通じてローカルで実行でき、クラウドサービスは必要ありません。

量子化バージョン

Q4_K_M量子化はモデルサイズと推論品質のバランスを取ります。

モデル能力

テキスト生成

対話システム

コンテンツ作成

使用事例

コンテンツ生成

クリエイティブライティング

物語、詩などのクリエイティブなコンテンツを生成します。

質問応答システム

ユーザーが提出した様々な質問に回答します。

開発支援

コード生成

コード断片の生成を支援します。

🚀 Aldaris/gemma-3-4b-it-Q4_K_M-GGUF

このプロジェクトでは、モデルを google/gemma-3-4b-it から GGUF 形式に変換しています。変換は llama.cpp を利用し、ggml.ai の GGUF-my-repo スペースを通じて行われます。このモデルの詳細情報については、元のモデルカードを参照してください。

🚀 クイックスタート

モデル情報

属性	詳細
ベースモデル	google/gemma-3-4b-it
ライブラリ名	transformers
ライセンス	gemma
タスクタイプ	画像テキストからテキストへの変換
タグ	llama-cpp, gguf-my-repo

アクセスに関する注意

⚠️ 重要な注意事項

Hugging Face 上で Gemma にアクセスするには、Google の使用許諾を確認して同意する必要があります。そのため、Hugging Face にログインし、以下のボタンをクリックしてください。リクエストはすぐに処理されます。

ボタンの内容：許諾を確認

📦 インストール

Homebrew を使用した llama.cpp のインストール（Mac と Linux 用）

brew install llama.cpp

💻 使用例

基本的な使用法

CLI を使用した呼び出し

llama-cli --hf-repo Aldaris/gemma-3-4b-it-Q4_K_M-GGUF --hf-file gemma-3-4b-it-q4_k_m.gguf -p "The meaning to life and the universe is"

サーバーを使用した呼び出し

llama-server --hf-repo Aldaris/gemma-3-4b-it-Q4_K_M-GGUF --hf-file gemma-3-4b-it-q4_k_m.gguf -c 2048

高度な使用法

このチェックポイントは、Llama.cpp リポジトリに記載されている使用手順を直接使用して利用することもできます。

手順 1：GitHub から llama.cpp をクローンする

git clone https://github.com/ggerganov/llama.cpp

手順 2：llama.cpp フォルダに移動し、`LLAMA_CURL=1` フラグとその他の特定のハードウェアフラグ（例えば、Linux で Nvidia GPU を使用する場合は `LLAMA_CUDA=1`）を使用してコンパイルする

cd llama.cpp && LLAMA_CURL=1 make

手順 3：メインバイナリを使用して推論を実行する

./llama-cli --hf-repo Aldaris/gemma-3-4b-it-Q4_K_M-GGUF --hf-file gemma-3-4b-it-q4_k_m.gguf -p "The meaning to life and the universe is"

または

./llama-server --hf-repo Aldaris/gemma-3-4b-it-Q4_K_M-GGUF --hf-file gemma-3-4b-it-q4_k_m.gguf -c 2048

📄 ライセンス

このプロジェクトは gemma ライセンスの下で提供されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご