S

Stablelm Zephyr 3b GGUF

由brittlewis12開發
StableLM Zephyr 3B是一個30億參數的指令調優模型,基於公開數據集、合成數據集和直接偏好優化(DPO)訓練,性能表現優異。
下載量 51
發布時間 : 4/25/2025

模型概述

這是一個30億參數的因果語言模型,專門針對指令任務進行了優化,適用於文本生成和對話任務。

模型特點

指令調優優化
模型經過專門的指令調優訓練,能夠更好地理解和執行用戶指令
直接偏好優化(DPO)
採用直接偏好優化方法訓練,提高了模型輸出的質量和相關性
多數據集訓練
基於多個高質量數據集訓練,包括ultrachat_200k、ultrafeedback_binarized等
GGUF格式支持
提供GGUF格式模型文件,便於在各種設備上運行

模型能力

文本生成
對話系統
指令理解與執行
內容創作

使用案例

對話系統
智能助手
可作為智能對話助手使用
在AlpacaEval評估中獲得76%勝率
內容創作
文本生成
可用於生成各種類型的文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase