G

Gemma 3 12b It GPTQ 4b 128g

ISTA-DASLabによって開発
このモデルはgoogle/gemma-3-12b-itをINT4量子化したバージョンで、GPTQアルゴリズムによりパラメータを16ビットから4ビットに削減し、ディスク容量とGPUメモリ要件を大幅に削減しました。
ダウンロード数 1,175
リリース時間 : 4/11/2025

モデル概要

Gemma-3-12b-itをベースにしたINT4量子化バージョンで、テキスト生成やマルチモーダルタスクに適しており、元のモデルの性能を大部分維持しながらリソース要件を大幅に低減しています。

モデル特徴

効率的なINT4量子化
GPTQアルゴリズムによりパラメータを16ビットから4ビットに削減し、ストレージとメモリ要件を約75%削減。
性能維持
OpenLLMベンチマークで元のモデルの98.42%の性能を維持。
マルチモーダルサポート
画像とテキストの統合処理をサポートし、画像内容を理解して説明できます。

モデル能力

テキスト生成
画像内容理解
マルチモーダルタスク処理
対話システム

使用事例

コンテンツ生成
画像キャプション生成
入力画像に基づいて詳細な説明を生成
画像内の物体やシーンを正確に識別し、流暢な説明を生成可能
インテリジェントアシスタント
マルチモーダル対話
画像とテキスト入力を組み合わせた対話
画像内容を理解し関連質問に回答可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase