I

Instella 3B

amdによって開発
AMD Instinct MI300X GPUでトレーニングされた30億パラメータの完全オープン言語モデルファミリーで、同規模のオープンモデルを性能で凌駕
ダウンロード数 3,048
リリース時間 : 3/5/2025

モデル概要

InstellaはAMDが開発した完全オープンソースの言語モデルシリーズで、事前学習、教師あり微調整、DPOアライメントバージョンを含み、4096トークンのコンテキスト長をサポート

モデル特徴

完全オープンモデル
モデル重み、トレーニング設定、データセットを完全公開し、コミュニティコラボレーションを促進
高性能
同規模の完全オープンモデルを超え、オープン重みモデルの性能に接近
AMDハードウェア最適化
Instinct MI300X GPUとROCmソフトウェアスタックに基づき特別に最適化
4段階トレーニング
事前学習、強化学習、教師あり微調整、DPOアライメントを含む完全なトレーニングプロセス

モデル能力

テキスト生成
指示追従
質問応答
対話インタラクション
知識推論

使用事例

インテリジェントアシスタント
対話システム
複雑な指示を理解できる対話AIを構築
Alpaca評価で優れたパフォーマンス
教育研究
AI教育アシスタント
学科問題に解答し段階的な説明を提供
MMLU総合評価で57.81点を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase