I

Instella 3B

由 amd 开发
AMD基于Instinct MI300X GPU训练的30亿参数全开放语言模型家族,性能超越同规模开放模型
下载量 3,048
发布时间 : 3/5/2025

模型简介

Instella是由AMD开发的完全开源语言模型系列,包含预训练、监督微调和DPO对齐版本,支持4096 tokens上下文长度

模型特点

全开放模型
完整公开模型权重、训练配置和数据集,促进社区协作
高性能
超越同规模全开放模型,接近开放权重模型性能
AMD硬件优化
基于Instinct MI300X GPU和ROCm软件栈专门优化
四阶段训练
包含预训练、增强训练、监督微调和DPO对齐的完整训练流程

模型能力

文本生成
指令跟随
问题解答
对话交互
知识推理

使用案例

智能助手
对话系统
构建能理解复杂指令的对话AI
在Alpaca评估中表现优异
教育研究
AI教学助手
解答学科问题并提供分步解释
在MMLU综合评估达到57.81分
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase