M

Mpt 7b Storywriter

由mosaicml開發
專為超長文本閱讀與創作設計的虛構故事生成模型,支持65k+ tokens上下文長度
下載量 769
發布時間 : 5/4/2023

模型概述

基於MPT-7B微調的長文本生成模型,專注於小說創作和長文本理解,採用ALiBi技術突破上下文長度限制

模型特點

超長上下文處理
支持65k tokens上下文窗口,推理時可擴展至84k+ tokens
ALiBi位置編碼
採用線性偏置注意力技術實現動態上下文擴展
高效訓練優化
集成FlashAttention、QK層歸一化等技術提升訓練效率
商業友好許可
Apache 2.0許可證允許商業用途

模型能力

長文本生成
小說創作
故事續寫
超長文本理解

使用案例

創意寫作
小說自動生成
根據開頭段落生成完整小說內容
展示過生成84k tokens連貫文本的能力
故事續寫
基於經典文學作品(如《了不起的蓋茨比》)生成後續情節
模型能保持原作文風並生成合理結局
長文本分析
超長文檔處理
對整本小說進行內容分析和摘要生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase