S

Summllama3 8B

由 DISLab 开发
SummLlama3-8B是基于Llama3-8B-Instruct初始化的文本摘要模型,通过大规模摘要反馈的DPO训练优化,在忠实性、完整性和简洁性上表现优异。
下载量 15
发布时间 : 10/11/2024

模型简介

专注于生成符合人类偏好的跨领域文本摘要,支持新闻、医疗、会议等七类场景,性能超越更大规模的Llama3-70B和GPT-4o。

模型特点

跨领域优化
覆盖新闻/医疗/会议等7个领域,适配对话与非对话文本
三指标均衡
在忠实性(0.98)、完整性(0.697)、简洁性(0.959)上全面领先
高效推理
8B参数规模实现优于70B模型的性能,推理速度更快
LLM反馈训练
采用10万+摘要的LLM生成反馈进行DPO训练,避免人工标注成本

模型能力

多领域文本摘要
对话内容浓缩
关键信息提取
长文本结构化压缩

使用案例

媒体行业
新闻简报生成
自动提炼新闻核心事实
保持事件脉络的同时减少70%文本量
医疗健康
病历摘要
提取诊疗关键信息
准确率较基线提升12%
企业办公
会议纪要生成
自动总结讨论要点和决议
完整捕捉行动项且无冗余信息
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase