S

Stable Vicuna 13b Delta

由 CarperAI 开发
StableVicuna-13B是基于Vicuna-13B v0模型,通过人类反馈强化学习(RLHF)和近端策略优化(PPO)在多种对话和指令数据集上进行微调的产物。
下载量 31
发布时间 : 4/26/2023

模型简介

StableVicuna-13B是一个基于LLaMA transformer架构的自回归语言模型,专注于对话任务的文本生成。

模型特点

强化学习微调
通过人类反馈强化学习(RLHF)和近端策略优化(PPO)在多种对话和指令数据集上进行微调。
多数据集训练
在OpenAssistant、GPT4All和Alpaca等多个高质量数据集上进行训练。
对话优化
专注于对话任务的文本生成,能够生成连贯、有意义的对话响应。

模型能力

文本生成
对话系统
指令跟随

使用案例

对话系统
智能助手
用于构建智能助手,能够理解并回应用户的指令和问题。
文本生成
代码生成
根据用户指令生成Python脚本等代码片段。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase