C

CAI Supernova R2

由Edens-Gate開發
該模型是基於arcee-ai/Llama-3.1-SuperNova-Lite在CharacterAI-logs和OpenCAI-ShareGPT數據集上進行微調的版本,支持長上下文處理。
下載量 43
發布時間 : 10/23/2024

模型概述

一個經過微調的大語言模型,專注於對話生成任務,支持16384的序列長度。

模型特點

長上下文支持
支持16384的序列長度,適合處理長文本和複雜對話場景
高效優化
使用LigerPlugin進行多項優化,包括rope、rms_norm和swiglu等技術
對話微調
在CharacterAI和ShareGPT對話數據集上進行專門微調

模型能力

文本生成
對話系統
長文本處理

使用案例

對話系統
智能聊天機器人
可用於構建具有長對話記憶能力的聊天機器人
內容生成
長文本生成
適合生成需要長上下文連貫性的內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase