A

Airoboros Dpo 70b 3.3

由 jondurbin 开发
基于Meta的Llama-3构建的实验性模型,使用airoboros生成的合成数据进行调优,并结合多种DPO数据集进行额外调优,擅长上下文问答、摘要生成、长文本生成等多种任务。
下载量 9,119
发布时间 : 5/10/2024

模型简介

该模型是对Llama-3-70b-instruct的微调版本,主要基于合成数据进行训练,支持多种复杂任务处理。

模型特点

多数据集训练
使用多个高质量数据集进行训练,包括airoboros-3.2、boolq等,提高了模型的泛化能力。
多功能支持
支持上下文问答、摘要生成、长文本生成、代码生成、函数调用等多种复杂任务。
特定格式支持
支持特定的提示格式,如封闭上下文问答格式,有助于模型更好地理解和处理输入。
DPO调优
结合多种DPO数据集进行额外调优,提高了模型的响应质量和准确性。

模型能力

上下文问答
文本摘要
长文本生成
代码生成
函数调用
思维链推理
执行计划生成
多步骤指令确认

使用案例

知识问答
封闭上下文问答
根据提供的上下文回答问题,避免知识幻觉
能准确基于上下文回答,并提供来源引用
内容生成
长文本创作
根据详细提示生成2300字左右的叙事文本
能生成结构完整、符合要求的文学作品
技术文档摘要
将长文本摘要为130字左右的精简内容
能保留关键信息并大幅压缩内容
开发辅助
代码生成
根据需求生成完整Python应用代码
能生成符合要求的可运行代码
函数调用
将自然语言指令转换为函数调用参数
能准确识别意图并生成正确的JSON格式调用
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase