Shuttle-3.5開源寫作AI模型 - 模擬Claude 3風格，支持角色扮演寫作

首頁

Shuttle 3.5

由shuttleai開發

Shuttle-3.5是基於Qwen3 32b微調的版本，模擬了Claude 3模型的寫作風格，並全面訓練了角色扮演數據。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #多模式推理切換 #高精度角色扮演 #超長上下文支持

下載量 225

發布時間 : 4/30/2025

模型概述

Shuttle-3.5是一個因果語言模型，支持思維模式與非思維模式的無縫切換，顯著提升了推理能力，更符合人類偏好，擅長代理能力，支持100多種語言和方言。

模型特點

思維模式與非思維模式切換

支持思維模式（用於複雜邏輯推理、數學和編碼）與非思維模式（用於高效通用對話）的無縫切換，確保在各種場景下都能發揮最佳性能。

提升推理能力

在數學、代碼生成和常識邏輯推理方面超越了之前的QwQ（思維模式）和Qwen2.5指令模型（非思維模式）。

符合人類偏好

在創意寫作、角色扮演、多輪對話和指令遵循方面表現出色，提供更自然、引人入勝和沉浸式的對話體驗。

擅長代理能力

能夠在思維和非思維模式下精確整合外部工具，並在複雜的基於代理的任務中實現開源模型的領先性能。

多語言支持

支持100多種語言和方言，具備強大的多語言指令遵循和翻譯能力。

模型能力

文本生成

複雜邏輯推理

數學計算

代碼生成

角色扮演

多輪對話

指令遵循

多語言翻譯

使用案例

創意寫作

故事創作

生成引人入勝的故事情節和角色對話

提供更自然、引人入勝和沉浸式的對話體驗

技術開發

代碼生成

生成高質量的代碼片段

在代碼生成方面超越之前的模型

教育

數學推理

解決複雜的數學問題

在數學推理方面超越之前的模型

屬性	詳情
模型類型	因果語言模型
訓練階段	預訓練和後訓練
參數數量	328億
參數數量（非嵌入層）	312億
層數	64
注意力頭數量（GQA）	Q為64，KV為8
上下文長度	原生32,768，使用YaRN可達131,072個標記

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Shuttle 3.5

模型概述

模型特點

模型能力

使用案例

🚀 Shuttle-3.5

🚀 快速開始

🔗 通過API使用 • 💬 ShuttleChat

✨ 主要特性

📚 詳細文檔

模型概述

微調詳情

📄 許可證