Llama3.1-Gutenberg-Doppel-70B开源大语言模型 - 基于微调实现高效语言交互

Llama3.1 Gutenberg Doppel 70B

由 nbeerbower 开发

基于Hermes-3-Llama-3.1-70B-lorablated模型，在Gutenberg数据集上进行微调的大语言模型

下载量 424

发布时间 : 10/11/2024

模型简介

该模型是一个70B参数规模的大语言模型，专注于文本生成任务，在Gutenberg数据集上进行了优化，适用于多种自然语言处理场景。

Gutenberg数据集微调

在jondurbin/gutenberg-dpo-v0.1和nbeerbower/gutenberg2-dpo数据集上进行了专门优化

ORPO调优

使用ORPO方法进行了3个epoch的调优，提升了模型性能

高性能

在Open LLM Leaderboard多个评估任务中表现优异

文本生成

指令遵循

知识问答

教育

阅读理解

帮助学生理解复杂文本内容

研究

文献分析

辅助研究人员快速分析大量文献

属性	详情
许可证	llama3.1
库名称	transformers
基础模型	mlabonne/Hermes-3-Llama-3.1-70B-lorablated
训练数据	jondurbin/gutenberg-dpo-v0.1、nbeerbower/gutenberg2-dpo