I

Instella 3B Stage1

amdによって開発
InstellaはAMDが開発した30億パラメータのオープンソース言語モデルシリーズで、AMD Instinct™ MI300X GPUでトレーニングされ、同規模の完全オープンソースモデルを性能で凌駕しています。
ダウンロード数 397
リリース時間 : 3/5/2025

モデル概要

Instellaシリーズは完全にオープンソースの先進的な30億パラメータ言語モデルで、性能面で既存の同規模完全オープンソースモデルを上回り、トップクラスのオープンソース重みモデルと同等の性能を発揮します。

モデル特徴

高性能
30億パラメータ規模において既存の完全オープンソースモデルを性能で上回り、トップクラスのオープンソース重みモデルと同等
完全オープンソース
完全なモデル重み、トレーニング設定、データセットおよびコードをオープンソース化
効率的なトレーニング
FlashAttention-2、Torch Compile、混合シャーディングFSDPなどの効率的なトレーニング技術を採用
多段階トレーニング
事前トレーニング、教師あり微調整、DPOアライメントを含む複数のトレーニング段階を実施

モデル能力

テキスト生成
命令追従
質問応答
対話インタラクション

使用事例

自然言語処理
インテリジェントQA
ユーザーの様々な質問に回答
OLMES、FastChat MT-Benchなどのベンチマークテストで優れた成績
テキスト生成
プロンプトに基づいて一貫性のあるテキストコンテンツを生成
4096トークンのコンテキスト長をサポート
教育
学習支援
学生が複雑な概念を理解するのを支援
科学QA(SciQ)タスクで96.6%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase