Shuttle 3.5
Shuttle-3.5是基於Qwen3 32b微調的版本,模擬了Claude 3模型的寫作風格,並全面訓練了角色扮演數據。
下載量 225
發布時間 : 4/30/2025
模型概述
Shuttle-3.5是一個因果語言模型,支持思維模式與非思維模式的無縫切換,顯著提升了推理能力,更符合人類偏好,擅長代理能力,支持100多種語言和方言。
模型特點
思維模式與非思維模式切換
支持思維模式(用於複雜邏輯推理、數學和編碼)與非思維模式(用於高效通用對話)的無縫切換,確保在各種場景下都能發揮最佳性能。
提升推理能力
在數學、代碼生成和常識邏輯推理方面超越了之前的QwQ(思維模式)和Qwen2.5指令模型(非思維模式)。
符合人類偏好
在創意寫作、角色扮演、多輪對話和指令遵循方面表現出色,提供更自然、引人入勝和沉浸式的對話體驗。
擅長代理能力
能夠在思維和非思維模式下精確整合外部工具,並在複雜的基於代理的任務中實現開源模型的領先性能。
多語言支持
支持100多種語言和方言,具備強大的多語言指令遵循和翻譯能力。
模型能力
文本生成
複雜邏輯推理
數學計算
代碼生成
角色扮演
多輪對話
指令遵循
多語言翻譯
使用案例
創意寫作
故事創作
生成引人入勝的故事情節和角色對話
提供更自然、引人入勝和沉浸式的對話體驗
技術開發
代碼生成
生成高質量的代碼片段
在代碼生成方面超越之前的模型
教育
數學推理
解決複雜的數學問題
在數學推理方面超越之前的模型
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98