C

Causallm 14B DPO Alpha GGUF

由tastypear開發
基於14B參數的因果語言模型,經過DPO優化訓練,支持中英文文本生成任務
下載量 2,238
發布時間 : 11/25/2023

模型概述

這是一個經過直接偏好優化(DPO)訓練的14B參數因果語言模型,專為文本生成任務設計,支持中英文雙語處理。模型在MT-Bench基準測試中表現優異,接近GPT-3.5水平。

模型特點

DPO優化訓練
採用直接偏好優化方法訓練,使模型輸出更符合人類偏好
雙語支持
同時支持英文和中文文本生成任務
高性能表現
在MT-Bench基準測試中得分7.618868,接近GPT-3.5水平
GGUF格式支持
提供GGUF格式模型文件,兼容多種推理客戶端和庫

模型能力

文本生成
對話系統
問答系統
內容創作

使用案例

智能對話
聊天機器人
構建中英文雙語聊天機器人
接近GPT-3.5水平的對話體驗
內容創作
文章生成
根據提示生成中英文文章
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase