M

Mistral NeMo Minitron 8B Base

nvidiaによって開発
Mistral-NeMo-Minitron-8B-Baseは基礎的なテキスト生成モデルで、Mistral-NeMo 12Bを剪枝と蒸留することで得られ、様々な自然言語生成タスクに適しています。
ダウンロード数 7,924
リリース時間 : 8/19/2024

モデル概要

このモデルは大規模言語モデル(LLM)で、Mistral-NeMo 12Bを剪枝と蒸留することで得られ、様々なテキストタスクを効果的に処理でき、自然言語処理に強力なサポートを提供します。

モデル特徴

剪枝と蒸留による最適化
Mistral-NeMo 12Bを剪枝と蒸留することで得られ、モデル規模を縮小しながら性能を維持します。
効率的なトレーニング
剪枝後、3800億個のトークンを使用して蒸留式の継続的トレーニングを行い、モデル性能を最適化します。
先進的なアーキテクチャ
グループ化クエリアテンション(GQA)や回転位置埋め込み(RoPE)などの先進的な技術を採用しています。

モデル能力

テキスト生成
段落補完
言語理解
コード生成

使用事例

コンテンツ生成
段落補完
プロンプトに基づいて段落内容を補完します。
一貫性のある後続のテキストを生成します。
教育
科学知識の質問応答
科学分野に関する質問に回答します。
正確な科学知識の説明を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase