S

Starling LM 7B Alpha

由berkeley-nest開發
首個基於AI反饋強化學習(RLAIF)訓練的開源大語言模型,在MT Bench測試中表現優異
下載量 9,765
發布時間 : 11/25/2023

模型概述

基於Openchat 3.5微調的語言模型,通過Nectar數據集和獎勵訓練實現高性能對話能力

模型特點

RLAIF訓練
首個採用AI反饋強化學習訓練的開源大語言模型
高性能對話
在MT Bench測試中獲得8.09分,超越同類模型
多輪對話支持
支持複雜的多輪對話場景
編程輔助
具備代碼生成和編程問題解答能力

模型能力

文本生成
多輪對話
代碼生成
問題解答

使用案例

智能助手
日常對話
進行自然流暢的日常對話交流
在AlpacaEval評估中獲得91.99分
編程輔助
代碼生成
根據需求生成各種編程語言的代碼
支持C++等多種語言的代碼實現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase