S

Summllama3 8B

由DISLab開發
SummLlama3-8B是基於Llama3-8B-Instruct初始化的文本摘要模型,通過大規模摘要反饋的DPO訓練優化,在忠實性、完整性和簡潔性上表現優異。
下載量 15
發布時間 : 10/11/2024

模型概述

專注於生成符合人類偏好的跨領域文本摘要,支持新聞、醫療、會議等七類場景,性能超越更大規模的Llama3-70B和GPT-4o。

模型特點

跨領域優化
覆蓋新聞/醫療/會議等7個領域,適配對話與非對話文本
三指標均衡
在忠實性(0.98)、完整性(0.697)、簡潔性(0.959)上全面領先
高效推理
8B參數規模實現優於70B模型的性能,推理速度更快
LLM反饋訓練
採用10萬+摘要的LLM生成反饋進行DPO訓練,避免人工標註成本

模型能力

多領域文本摘要
對話內容濃縮
關鍵信息提取
長文本結構化壓縮

使用案例

媒體行業
新聞簡報生成
自動提煉新聞核心事實
保持事件脈絡的同時減少70%文本量
醫療健康
病歷摘要
提取診療關鍵信息
準確率較基線提升12%
企業辦公
會議紀要生成
自動總結討論要點和決議
完整捕捉行動項且無冗餘信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase