Llama3.1-Gutenberg-Doppel-70B開源大語言模型 - 基於微調實現高效語言交互

Llama3.1 Gutenberg Doppel 70B

由nbeerbower開發

基於Hermes-3-Llama-3.1-70B-lorablated模型，在Gutenberg數據集上進行微調的大語言模型

下載量 424

發布時間 : 10/11/2024

模型概述

該模型是一個70B參數規模的大語言模型，專注於文本生成任務，在Gutenberg數據集上進行了優化，適用於多種自然語言處理場景。

Gutenberg數據集微調

在jondurbin/gutenberg-dpo-v0.1和nbeerbower/gutenberg2-dpo數據集上進行了專門優化

ORPO調優

使用ORPO方法進行了3個epoch的調優，提升了模型性能

高性能

在Open LLM Leaderboard多個評估任務中表現優異

文本生成

指令遵循

知識問答

教育

閱讀理解

幫助學生理解複雜文本內容

研究

文獻分析

輔助研究人員快速分析大量文獻

屬性	詳情
許可證	llama3.1
庫名稱	transformers
基礎模型	mlabonne/Hermes-3-Llama-3.1-70B-lorablated
訓練數據	jondurbin/gutenberg-dpo-v0.1、nbeerbower/gutenberg2-dpo