G

Gemma 3 12b It Qat

unslothによって開発
Gemma 3はGoogleが開発した軽量で最先端のマルチモーダルオープンソースモデルで、テキストと画像の入力を処理し、テキスト出力を生成できます。様々なテキスト生成と画像理解タスクに適しています。
ダウンロード数 952
リリース時間 : 4/21/2025

モデル概要

Gemma 3はGeminiモデルと同じ研究と技術に基づいて構築されたマルチモーダルモデルで、テキストと画像の入力をサポートし、テキスト出力を生成します。128Kの大きな文脈ウィンドウを持ち、140種類以上の言語をサポートし、質問応答、要約、推論などのタスクに適しています。

モデル特徴

マルチモーダル処理
テキストと画像の入力を同時に処理し、テキスト出力を生成できます。
大きな文脈ウィンドウ
128Kの大きな文脈ウィンドウを持ち、長いテキストと複雑なタスクの処理に適しています。
多言語サポート
140種類以上の言語をサポートし、広範な言語カバレッジを持っています。
軽量化設計
比較的小さいモデルサイズで、リソースが限られた環境でのデプロイに適しています。
量子化感知トレーニング
QAT技術を採用し、メモリ要件を削減しながらbfloat16に近い品質を維持します。

モデル能力

テキスト生成
画像分析
多言語処理
コード生成
数学的推論
文書要約
質問応答システム
ビジュアル質問応答

使用事例

コンテンツ作成とコミュニケーション
テキスト生成
詩、脚本、コード、マーケティングコピー、電子メール草稿などの創造的なテキスト形式を生成します。
チャットボットと対話型AI
カスタマーサービス、バーチャルアシスタント、またはインタラクティブアプリケーションの対話インターフェースを提供します。
画像データ抽出
視覚データを抽出、解釈、要約してテキスト通信に使用します。
研究と教育
自然言語処理研究
研究員がVLMとNLP技術を試すための基礎として使用されます。
言語学習ツール
インタラクティブな言語学習体験をサポートし、文法修正や作文練習を支援します。
知識探索
要約を生成したり、特定のトピックに関する質問に答えることで、研究員が大量のテキストを探索するのを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase