G

Gemma 3 12b Pt Bnb 4bit

unslothによって開発
Gemma 3はGoogleが発表した軽量オープンモデルシリーズで、Geminiと同じ技術を基に構築され、マルチモーダル入力とテキスト生成をサポートします。
ダウンロード数 2,509
リリース時間 : 3/14/2025

モデル概要

Gemma 3はマルチモーダルモデルで、テキストと画像の入力を処理し、テキスト出力を生成できます。さまざまなテキスト生成と画像理解タスクに適しています。128Kの大きなコンテキストウィンドウを持ち、140種類以上の言語をサポートし、リソース要件が比較的低いです。

モデル特徴

マルチモーダル処理
テキストと画像の入力をサポートし、画像記述生成やビジュアル質問応答などのクロスモーダルタスクを実行できます。
大きなコンテキストウィンドウ
128Kトークンのコンテキストウィンドウ(1Bバージョンは32K)で、長いドキュメントの処理をサポートします。
リソース効率が高い
比較的小さいモデルサイズで、消費者向けハードウェアで実行でき、メモリ使用量を80%削減します。
セキュリティ強化
子供の安全性、コンテンツの安全性、偏見の削減に関して、前代のモデルよりも大幅な改善が見られます。
多言語対応
140種類以上の言語をサポートし、非ラテン語系や低リソース言語も含まれます。

モデル能力

テキスト生成
画像内容分析
多言語翻訳
コード生成
数学的推論
ドキュメント要約
ビジュアル質問応答
クロスモーダル理解

使用事例

コンテンツ作成
マーケティングコピー生成
製品画像と簡単な説明に基づいて、自動的にマーケティングコピーを生成します。
コンテンツ作成の効率を向上させます。
脚本作成
シーンの説明に基づいて、脚本の断片を生成します。
カスタマーサービス
スマートカスタマーサービス
製品画像を含む顧客の問い合わせを処理します。
人工のカスタマーサービスの負荷を軽減します。
教育研究
学術論文要約
複雑な研究論文から重要な発見を抽出します。
HellaSwagベンチマークの10-shotで85.6点(27B)
プログラミング教育
コード断片を説明し、教育用のサンプルを生成します。
HumanEvalベンチマークの0-shotで48.8点(27B)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase