Llama-3.3-70B-Vulpecula-r1開源思維型模型 - 免費部署提升創意寫作與角色扮演能力

首頁

Llama 3.3 70B Vulpecula R1

由Sao10K開發

基於Meta的Llama 3.3-70B-Instruct微調的思維型模型，專注於創意寫作和角色扮演能力提升

大型語言模型

Transformers

英語#思維鏈激活 #創意寫作增強 #角色扮演優化

下載量 1,279

發布時間 : 3/20/2025

模型概述

這是一個受Deepseek-R1啟發的思維型語言模型，通過SFT和少量RL在創意寫作數據上訓練，顯著提升了指令遵循、角色扮演和創意控制能力

模型特點

思維模式激活

通過在助手回覆前添加<think>標籤可激活思維模式，增強推理能力

創意寫作優化

專門針對創意寫作和角色扮演場景進行了優化訓練

高質量數據篩選

使用經過嚴格篩選和重構的半合成對話/角色扮演數據集

多源數據融合

整合了人工標註數據、LLM生成數據和Deepseek-R1的推理軌跡數據

模型能力

指令遵循

角色扮演

創意寫作

自然對話

推理思考

使用案例

創意寫作

小說創作

協助作者生成創意性文本和故事情節

能夠生成連貫且富有創意的敘事文本

角色扮演

模擬不同角色的對話和互動

能夠保持角色一致性並生成符合角色特徵的對話

對話系統

智能助手

作為智能助手提供自然流暢的對話體驗

能夠理解複雜指令並給出有邏輯的回應

🚀 🦊 L3.3-70B-Vulpecula 🌸

這是一個由 GradientPutri 和 Sao10K 合作的項目。過去幾周，我們滿懷熱情地投入其中，希望大家會喜歡它。儘管可能存在一些小問題，但最終的成果很不錯，能輸出令人滿意的結果，這也是我們的主要目標。模型卡片由 GradientPutri 製作。

🚀 快速開始

本模型基於 Meta 的 Llama 3.3，使用時需遵循 Llama 3.3 社區許可協議和可接受使用政策。

✨ 主要特性

🌟 這是一個受 Deepseek - R1 啟發的基於思考的模型，通過 SFT 和少量 RL 在創意寫作數據上進行訓練。
🧠 可以在助手回覆前加上 <think>\n 來激活思考模式，不過即使不使用思考模式，模型也能很好地工作。
🚀 相較於基礎模型，提升了可控性、指令角色扮演能力和創意控制能力。

📚 詳細文檔

📚 數據集組成

👾 重新制作、清理和過濾了半合成的聊天/角色扮演數據集，去除了重複內容，保證了質量和輸出效果。
🎭 對基於人類的自然聊天/角色扮演數據集進行了清理、過濾和質量檢查。
📝 從幾個不同的大語言模型中收集了多樣化的指令數據集，並清理和過濾了拒絕回覆和低質量內容。
💭 從 Deepseek - R1 中提取了用於指令、聊天和創意任務的推理痕跡，並進行了質量過濾和清理。
█▓▒ 本項目不需要毒性/去審查數據，模型本身已經具有足夠的開放性。

總令牌數：約 2.7 億令牌（2.1 億可訓練），訓練超過 2 個週期。

🎨 格式和採樣器

指令格式：Llama - 3 - Instruct

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

{system_prompt}<|eot_id|><|start_header_id|>user<|end_header_id|>

{input}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

{output}<|eot_id|>
---
Note that newlines are represented within example above

✨ 採樣器推薦

temperature: 0.75
min_p: 0.1
Repetition Penalty: 1.1
Presence Penalty: 1.1

⚙️ 訓練細節

# Iterations
num_epochs: 2

# Batching - Global Batch 4x GPUs × Batch 2 × 4 Grad_accum = 32
gradient_accumulation_steps: 4
micro_batch_size: 2

# Optimizer
optimizer: paged_ademamix_8bit
lr_scheduler: cosine
learning_rate: 0.00002
max_grad_norm: 1
weight_decay: 0.01

📄 許可證

本模型使用 llama3.3 許可證。

屬性	詳情
模型類型	基於 Meta 的 Llama 3.3 的改進模型
基礎模型	meta - llama/Llama - 3.3 - 70B - Instruct
庫名稱	transformers

⚠️ 重要提示

雖然我們無法禁止商業使用，但請注意，這是一個使用我們自己的資源、時間和精力完成的項目。我們不希望未來在進行項目模型開發時受到打擊。我們懇請商業用戶在部署前與我們聯繫，討論使用方式和適當的歸屬問題。我們感謝那些通過告知我們工作的使用情況來幫助維護人工智能生態系統透明度的用戶。對於任何合併或衍生作品，也希望能如此。

🦊 感謝訪問！願狐狸為你帶來好運！ 🌸