B

Btlm 3b 8k Chat

由cerebras開發
BTLM-3B-8k-chat是基於BTLM-3B-8K-base開發的對話版本,採用DPO方法優化,專為符合人類偏好的對話場景設計。
下載量 138
發布時間 : 12/5/2023

模型概述

該模型是專為對話場景優化的語言模型,通過DPO訓練在Anthropic-HH-RLHF數據集上微調,提升了對話能力和實用性。

模型特點

商用許可
採用Apache 2.0協議,允許商業使用
性能提升
在10項下游任務和MMLU基準上較基礎模型提升2.26%
增強對話能力
通過DPO訓練優化了對話交互質量
降低有害性
減少了有害內容生成,提高實用性

模型能力

文本生成
對話交互
知識問答
內容創作

使用案例

教育
知識問答
回答各類知識性問題
能提供準確的知識性回答
研究
倫理對齊研究
作為研究人類偏好對齊的基礎模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase