G

Granite 3.1 1b A400m Base

ibm-graniteによって開発
Granite-3.1-1B-A400M-BaseはIBMが開発した言語モデルで、漸進的トレーニング戦略を通じて文脈長を4Kから128Kに拡張し、多言語と様々なテキスト処理タスクをサポートしています。
ダウンロード数 3,299
リリース時間 : 12/6/2024

モデル概要

このモデルは主にテキスト生成、要約、分類、抽出、質問応答などの様々なタスクに使用され、12の言語をサポートし、疎なエキスパート混合(MoE)Transformerアーキテクチャを採用しています。

モデル特徴

長文脈サポート
漸進的トレーニング戦略を通じて、文脈長を4Kから128Kに拡張します。
多言語サポート
英語、中国語、日本語など12の言語をサポートします。
疎なエキスパート混合アーキテクチャ
MoEアーキテクチャを採用し、細粒度のエキスパート、トークン破棄なしのルーティング、負荷分散損失を含みます。

モデル能力

テキスト生成
テキスト要約
テキスト分類
情報抽出
質問応答システム

使用事例

テキスト処理
質問応答システム
ユーザーが提出した質問に回答します。例:「Thomas J. Watson Research Centerはどこにありますか?」
正確な回答を生成します
テキスト要約
長いテキストを要約し、重要な情報を抽出します。
簡潔な要約を生成します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase