S

Starling LM 11B Alpha

由CallComply開發
Starling-7B是一個通過AI反饋強化學習(RLAIF)訓練的開源大語言模型,基於Openchat 3.5微調,在MT Bench中表現優異。
下載量 103
發布時間 : 12/3/2023

模型概述

Starling-7B是一個通過RLHF/RLAIF微調的語言模型,主要用於文本生成任務,具有較高的對話和推理能力。

模型特點

RLAIF訓練
使用AI反饋強化學習(RLAIF)進行微調,提升了模型的對話和推理能力。
高性能
在MT Bench中以GPT-4作為評委獲得了8.09分,超越了除OpenAI的GPT-4和GPT-4 Turbo之外的所有現有模型。
開源
模型、排名數據集和獎勵模型均已開源,便於研究和應用。

模型能力

文本生成
對話系統
推理任務

使用案例

對話系統
智能客服
用於構建高性能的智能客服系統,提供自然流暢的對話體驗。
教育
學習助手
幫助學生解答問題,提供學習建議和資源推薦。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase