O

Oasst Sft 4 Pythia 12b Epoch 3.5

由 OpenAssistant 开发
基于Pythia 12B架构的英文监督微调模型,通过Open-Assistant项目的人类反馈数据训练,专注于对话生成任务。
下载量 24.47k
发布时间 : 4/3/2023

模型简介

这是Open-Assistant项目的第4代英文监督微调模型,基于Pythia 12B架构,通过人类反馈网络收集的助手对话数据进行微调,主要用于生成自然语言回复。

模型特点

人类反馈数据训练
使用Open-Assistant平台收集的人类反馈数据进行监督微调,提高对话质量。
专用对话标记
使用特殊标记区分用户与助手对话轮次,优化对话生成效果。
大规模预训练基础
基于EleutherAI的Pythia-12B模型,具备强大的语言理解和生成能力。

模型能力

文本生成
对话系统
问答回答
创意写作

使用案例

对话系统
智能助手
用于构建智能对话助手,回答用户问题或提供帮助。
内容生成
故事创作
根据提示生成连贯的故事或文章。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase