I

Instella 3B Stage1

由amd開發
Instella是由AMD開發的30億參數開源語言模型系列,基於AMD Instinct™ MI300X GPU訓練,性能超越同規模全開源模型。
下載量 397
發布時間 : 3/5/2025

模型概述

Instella系列是完全開源的先進30億參數語言模型,在性能上超越現有同規模全開源模型,並與頂尖開源權重模型表現相當。

模型特點

高性能
在30億參數規模下性能超越現有全開源模型,與頂尖開源權重模型相當
完全開源
完整開源模型權重、訓練配置、數據集和代碼
高效訓練
採用FlashAttention-2、Torch Compile和混合分片的FSDP等高效訓練技術
多階段訓練
包含預訓練、監督微調和DPO對齊多個訓練階段

模型能力

文本生成
指令跟隨
問題解答
對話交互

使用案例

自然語言處理
智能問答
回答用戶提出的各種問題
在OLMES、FastChat MT-Bench等基準測試中表現優異
文本生成
根據提示生成連貫的文本內容
支持4096 token的上下文長度
教育
學習輔助
幫助學生理解複雜概念
在科學問答(SciQ)任務中達到96.6%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase