I

Instella 3B

由amd開發
AMD基於Instinct MI300X GPU訓練的30億參數全開放語言模型家族,性能超越同規模開放模型
下載量 3,048
發布時間 : 3/5/2025

模型概述

Instella是由AMD開發的完全開源語言模型系列,包含預訓練、監督微調和DPO對齊版本,支持4096 tokens上下文長度

模型特點

全開放模型
完整公開模型權重、訓練配置和數據集,促進社區協作
高性能
超越同規模全開放模型,接近開放權重模型性能
AMD硬件優化
基於Instinct MI300X GPU和ROCm軟件棧專門優化
四階段訓練
包含預訓練、增強訓練、監督微調和DPO對齊的完整訓練流程

模型能力

文本生成
指令跟隨
問題解答
對話交互
知識推理

使用案例

智能助手
對話系統
構建能理解複雜指令的對話AI
在Alpaca評估中表現優異
教育研究
AI教學助手
解答學科問題並提供分步解釋
在MMLU綜合評估達到57.81分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase