I

Instella 3B

Developed by amd
AMD Instinct MI300X GPUでトレーニングされた30億パラメータの完全オープン言語モデルファミリーで、同規模のオープンモデルを性能で凌駕
Downloads 3,048
Release Time : 3/5/2025

Model Overview

InstellaはAMDが開発した完全オープンソースの言語モデルシリーズで、事前学習、教師あり微調整、DPOアライメントバージョンを含み、4096トークンのコンテキスト長をサポート

Model Features

完全オープンモデル
モデル重み、トレーニング設定、データセットを完全公開し、コミュニティコラボレーションを促進
高性能
同規模の完全オープンモデルを超え、オープン重みモデルの性能に接近
AMDハードウェア最適化
Instinct MI300X GPUとROCmソフトウェアスタックに基づき特別に最適化
4段階トレーニング
事前学習、強化学習、教師あり微調整、DPOアライメントを含む完全なトレーニングプロセス

Model Capabilities

テキスト生成
指示追従
質問応答
対話インタラクション
知識推論

Use Cases

インテリジェントアシスタント
対話システム
複雑な指示を理解できる対話AIを構築
Alpaca評価で優れたパフォーマンス
教育研究
AI教育アシスタント
学科問題に解答し段階的な説明を提供
MMLU総合評価で57.81点を達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase