L

L3 8B Stheno V3.3 32K

由Sao10K開發
基於Llama-3-8B優化的32K長上下文模型,通過PoSE訓練擴展上下文長度,專注於角色扮演和創意寫作任務
下載量 541
發布時間 : 6/22/2024

模型概述

該模型是通過PoSE訓練方法將8K上下文擴展至32K的Llama-3-8B優化版本,特別強化了角色扮演和創意寫作能力,同時保持了基礎語言理解能力

模型特點

擴展上下文處理
通過PoSE訓練方法將上下文長度從8K擴展至32K,優於常規rope縮放方案
高質量角色扮演
經過深度清理和人工篩選的角色扮演樣本,提供優異的交互體驗
創意寫作增強
創意寫作訓練樣本翻倍,顯著提升生成質量
優化訓練配置
採用經過調試的最優Rope Theta值(200萬)配置,確保訓練穩定性

模型能力

長文本生成
角色扮演對話
創意內容創作
指令跟隨
上下文理解

使用案例

娛樂與創作
互動式角色扮演
與AI進行沉浸式角色扮演對話
主觀體驗報告顯示交互質量優異
創意寫作輔助
生成小說、詩歌等創意文本
訓練數據中創意寫作樣本增加2倍
長文檔處理
長文摘要
處理長達32K上下文的文檔摘要任務
基礎測試顯示優於常規rope縮放方案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase