C

Causallm 7B DPO Alpha GGUF

由tastypear開發
基於Llama 2架構的7B參數大語言模型,經過DPO訓練優化,支持中英文文本生成
下載量 367
發布時間 : 11/19/2023

模型概述

這是一個經過DPO優化的7B參數大語言模型,基於Llama 2架構,支持中英文文本生成任務。模型在多個數據集上訓練,包括Guanaco、OpenOrca等,旨在提供更符合人類偏好的文本生成能力。

模型特點

DPO優化
模型經過直接偏好優化(DPO)訓練,能生成更符合人類偏好的文本
多數據集訓練
在Guanaco、OpenOrca、UltraChat等20多個高質量數據集上訓練
中英雙語支持
同時支持英文和中文文本生成任務
GGUF量化格式
提供多種量化版本的GGUF格式模型文件,便於不同硬件部署

模型能力

文本生成
對話系統
問答系統
內容創作

使用案例

對話系統
智能助手
可用於構建智能對話助手
在MT-Bench基準測試中得分7.038
內容創作
文本生成
可用於生成各種類型的文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase