G

Gemma 3 12b It Qat Q4 0 Gguf

googleによって開発
Gemma 3はGoogleが提供する軽量で最先端のオープンソースマルチモーダルモデルで、画像とテキストの入力とテキスト出力をサポートし、128Kのコンテキストウィンドウと140以上の言語に対応しています。
ダウンロード数 40.86k
リリース時間 : 3/12/2025

モデル概要

Gemini技術を基に構築された軽量オープンソースモデルで、質問応答、要約、推論などのテキスト生成と画像理解タスクに適しており、リソースが限られた環境でのデプロイ能力を特に最適化しています。

モデル特徴

マルチモーダル能力
画像とテキストの入力をサポートし、クロスモーダル情報処理と分析が可能
超大規模コンテキストウィンドウ
12Bバージョンは128Kトークンのコンテキスト長をサポートし、長文書の処理に適している
量子化認識トレーニング
QAT技術を採用して効率的な量子化を実現し、メモリ使用量を削減しながらモデル品質を維持
多言語サポート
トレーニングデータは140以上の言語をカバーし、言語横断的な理解能力を備えている

モデル能力

テキスト生成
画像分析
多言語処理
論理的推論
コード生成
数学計算

使用事例

コンテンツ作成
コピーライティング生成
プロンプトに基づいてマーケティングコピーやクリエイティブコンテンツを生成
画像説明
入力画像に対して詳細な説明を生成
研究教育
言語学習支援
多言語翻訳と学習サポートを提供
NLP研究
自然言語処理研究のためのベースモデルとして利用
インテリジェントダイアログ
カスタマーサービスボット
画像とテキスト入力を理解できるインテリジェントカスタマーサービスシステムを構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase