G

Gemma 3 1b It Qat Q4 0 Unquantized

googleによって開発
Gemma 3はGoogleが提供する軽量オープンソースのマルチモーダルモデルシリーズで、Gemini技術を基盤に構築されており、テキストと画像の入力をサポートし、テキスト出力を生成します。1Bバージョンはインストラクションチューニングと量子化対応トレーニング(QAT)を経ており、リソースが限られた環境でのデプロイに適しています。
ダウンロード数 246
リリース時間 : 4/8/2025

モデル概要

Gemma 3はマルチモーダルモデルで、テキストと画像の入力を処理しテキスト出力を生成でき、質問応答、要約、推論など様々なタスクに適用可能です。1Bバージョンはインストラクションチューニングを施されており、高品質を維持しながらメモリ要件を削減しています。

モデル特徴

量子化対応トレーニング(QAT)
QAT技術を使用してモデルを最適化し、量子化後もbfloat16と同等の品質を維持可能で、メモリ要件を大幅に削減
マルチモーダル能力
テキストと画像入力(896x896解像度)をサポートし、複雑なマルチモーダルタスクを処理可能
大規模コンテキストウィンドウ
1Bバージョンは32Kトークンの入力コンテキストをサポートし、長文書や複雑なタスクの処理に適している
多言語サポート
140+言語を含むトレーニングデータを使用し、強力な多言語処理能力を備えている
責任あるAI設計
トレーニングデータは厳格にフィルタリングされ、有害・機微なコンテンツを除去し、GoogleのAI安全ポリシーに準拠

モデル能力

テキスト生成
画像コンテンツ分析
多言語処理
コード生成と理解
数学的推論
文書要約
質問応答システム
視覚的質問応答(VQA)

使用事例

コンテンツ作成とコミュニケーション
創造的テキスト生成
詩、脚本、マーケティングコピーなどの創造的コンテンツを生成
テーマやスタイル要件に合致した多様なテキストを生成可能
インテリジェントカスタマーサポート
対話型カスタマーサポートシステムを構築し、顧客の問い合わせを処理
複雑な質問を理解し正確な回答を提供可能
文書要約
長文書やレポートの簡潔な要約を自動生成
キー情報を抽出し、原文の核心を保持
研究と教育
言語学習支援
学習者のライティングと文法練習を支援
即時のフィードバックと修正提案を提供
知識探索
特定分野の質問に回答し、研究を支援
学際的な総合的なクエリを処理可能
視覚的理解
画像コンテンツ分析
画像の内容を解釈し説明
物体、シーン、画像内のテキストを正確に識別
文書情報抽出
スキャン文書や画像から構造化情報を抽出
表、グラフなど様々な文書フォーマットを処理可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase