S

Starling LM 7B Alpha

由 berkeley-nest 开发
首个基于AI反馈强化学习(RLAIF)训练的开源大语言模型,在MT Bench测试中表现优异
下载量 9,765
发布时间 : 11/25/2023

模型简介

基于Openchat 3.5微调的语言模型,通过Nectar数据集和奖励训练实现高性能对话能力

模型特点

RLAIF训练
首个采用AI反馈强化学习训练的开源大语言模型
高性能对话
在MT Bench测试中获得8.09分,超越同类模型
多轮对话支持
支持复杂的多轮对话场景
编程辅助
具备代码生成和编程问题解答能力

模型能力

文本生成
多轮对话
代码生成
问题解答

使用案例

智能助手
日常对话
进行自然流畅的日常对话交流
在AlpacaEval评估中获得91.99分
编程辅助
代码生成
根据需求生成各种编程语言的代码
支持C++等多种语言的代码实现
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase