S

Stable Vicuna 13b Delta

由CarperAI開發
StableVicuna-13B是基於Vicuna-13B v0模型,通過人類反饋強化學習(RLHF)和近端策略優化(PPO)在多種對話和指令數據集上進行微調的產物。
下載量 31
發布時間 : 4/26/2023

模型概述

StableVicuna-13B是一個基於LLaMA transformer架構的自迴歸語言模型,專注於對話任務的文本生成。

模型特點

強化學習微調
通過人類反饋強化學習(RLHF)和近端策略優化(PPO)在多種對話和指令數據集上進行微調。
多數據集訓練
在OpenAssistant、GPT4All和Alpaca等多個高質量數據集上進行訓練。
對話優化
專注於對話任務的文本生成,能夠生成連貫、有意義的對話響應。

模型能力

文本生成
對話系統
指令跟隨

使用案例

對話系統
智能助手
用於構建智能助手,能夠理解並回應用戶的指令和問題。
文本生成
代碼生成
根據用戶指令生成Python腳本等代碼片段。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase