M

Mpt 7b Storywriter

mosaicmlによって開発
超長テキストの読解と創作に特化した架空ストーリー生成モデルで、65k+トークンのコンテキスト長をサポート
ダウンロード数 769
リリース時間 : 5/4/2023

モデル概要

MPT-7Bを微調整した長文生成モデルで、小説創作と長文理解に焦点を当て、ALiBi技術でコンテキスト長の制限を突破

モデル特徴

超長コンテキスト処理
65kトークンのコンテキストウィンドウをサポートし、推論時には84k+トークンまで拡張可能
ALiBi位置エンコーディング
線形バイアス注意技術を用いた動的コンテキスト拡張を実現
効率的なトレーニング最適化
FlashAttention、QKレイヤー正規化などの技術を統合しトレーニング効率を向上
商用フレンドリーなライセンス
Apache 2.0ライセンスで商用利用が可能

モデル能力

長文生成
小説創作
ストーリー続き書き
超長文理解

使用事例

クリエイティブライティング
小説自動生成
冒頭段落に基づいて完全な小説コンテンツを生成
84kトークンの一貫性のあるテキスト生成能力を実証
ストーリー続き書き
古典文学作品(例:『グレート・ギャツビー』)に基づいて後続のプロットを生成
原作の文体を維持しつつ合理的な結末を生成可能
長文分析
超長文書処理
小説全体の内容分析と要約生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase