G

Gemma 3 4b It Quantized W4A16

abhishekchohanによって開発
Gemma 3はGoogleが開発した軽量オープンソース大規模言語モデルで、このリポジトリでは4Bパラメータ版のW4A16量子化モデルを提供し、ハードウェア要件を大幅に低減します。
ダウンロード数 592
リリース時間 : 3/17/2025

モデル概要

Gemma 3命令チューニングモデルに基づく4ビット重み量子化バージョンで、コンシューマー向けハードウェアデプロイに適し、良好な性能を維持しながらメモリ使用量を削減します。

モデル特徴

効率的な量子化
W4A16量子化技術を採用し、重みを4ビット精度に量子化し、活性化値を16ビット精度に保持することで、メモリ要件を大幅に低減します。
命令チューニング
命令チューニングにより最適化され、自然言語命令をより良く理解し実行できます。
コンシューマー向けハードウェア対応
量子化されたモデルはコンシューマー向けGPUやCPUでの実行に適しており、デプロイのハードルを下げます。

モデル能力

自然言語理解
テキスト生成
命令実行
対話インタラクション

使用事例

インテリジェントアシスタント
チャットボット
応答が速く理解力の高い対話システムを構築
流暢で自然な対話体験
コンテンツ生成
テキスト作成
執筆補助、要約作成などのタスクを支援
高品質なテキスト出力
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase