G

Gemma 3 1b It Qat Int4 Unquantized

googleによって開発
GemmaはGoogleが提供する軽量で先進的なオープンモデルシリーズで、Geminiと同じ技術に基づいて構築されており、マルチモーダル入力とテキスト生成をサポートします。
ダウンロード数 507
リリース時間 : 4/9/2025

モデル概要

Gemma 3はマルチモーダルモデルで、テキストと画像入力を処理しテキスト出力を生成でき、質問応答、要約、推論などのタスクに適しています。1B版はインストラクションチューニングと量子化認識トレーニング(QAT)を経ており、リソースが限られた環境でのデプロイに適しています。

モデル特徴

マルチモーダル処理能力
テキストと画像入力をサポートし、視覚的質問応答や画像内容分析などのクロスモーダルタスクを実行可能
量子化認識トレーニング(QAT)
QAT技術を採用してモデルを最適化し、メモリ要件を大幅に削減しながらbfloat16に近い品質を維持
大規模コンテキストウィンドウ
1B版は32Kトークンの入力コンテキストと8Kトークンの出力生成をサポート
軽量デプロイ
小型設計により、ノートパソコンやデスクトップPCなどのリソースが限られた環境でも実行可能

モデル能力

テキスト生成
画像理解
多言語処理
コード生成
数学的推論
ドキュメント要約
視覚的質問応答

使用事例

コンテンツ生成
自動ドキュメント要約
長文ドキュメントからキー情報を抽出・凝縮
簡潔で正確な要約を生成
クリエイティブライティング支援
プロンプトに基づいてストーリーや詩などのクリエイティブコンテンツを生成
多様なクリエイティブ出力を提供
知識質問応答
オープンドメインQA
様々な事実的・解釈的な質問に回答
TriviaQAベンチマークで39.8点(5-shot)を達成
視覚的質問応答
画像内容を分析し関連質問に回答
VQAv2ベンチマークで63.9点(4B版)を達成
教育支援
数学問題解決
代数、幾何などの数学問題を解決
GSM8Kベンチマークで38.4点(8-shot)を達成
プログラミング教育
コード概念の説明とサンプルコード生成
HumanEvalベンチマークで36点(0-shot)を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase