Violet_Twilight-v0.2開源模型 - 免費助力多語言文本生成任務

首頁

Violet Twilight V0.2

由Epiculous開發

Violet_Twilight-v0.2 是 Azure_Dusk-v0.2 和 Crimson_Dawn-v0.2 的 SLERP 合併模型，支持多語言文本生成任務。

大型語言模型

Safetensors

支持多種語言開源協議:Apache-2.0 #多語言角色扮演 #SLERP混合架構 #ChatML指令優化

下載量 145

發布時間 : 9/12/2024

模型概述

一個多語言文本生成模型，基於 ChatML 訓練，適用於角色扮演、指令跟隨等多種文本生成場景。

模型特點

多語言支持

支持9種語言的文本生成，包括中文、英文、日文等主要語言。

合併模型優勢

通過SLERP方法合併Azure_Dusk和Crimson_Dawn兩個模型的優勢。

ChatML兼容

基於ChatML訓練，提供標準化的對話格式支持。

量化版本

提供完整版、exl2版和gguf版三種量化版本，適應不同部署需求。

模型能力

多語言文本生成

角色扮演對話

指令跟隨

創意寫作

使用案例

對話系統

角色扮演對話

使用ChatML格式進行角色扮演對話

內容創作

創意寫作

生成各種風格的創意文本

🚀 Violet_Twilight-v0.2

Violet_Twilight-v0.2 是 Azure_Dusk-v0.2 和 Crimson_Dawn-v0.2 的 SLERP 合併模型，可用於文本生成任務。它支持多種量化版本，在多個評估數據集上有相應表現。

image/png

✨ 主要特性

多語言支持：支持英語、法語、德語、西班牙語、意大利語、葡萄牙語、俄語、中文和日語。
多數據集訓練：基於多個數據集進行訓練，包括 Epiculous/SynthRP-Gens-v1.1-Filtered-n-Cleaned、anthracite-org/stheno-filtered-v1.1 等。
文本生成能力：適用於文本生成任務。
多種量化版本：提供完整版本、exl2 和 gguf 量化版本。

📦 安裝指南

文檔未提供具體安裝步驟，暫不展示。

💻 使用示例

基礎用法

v0.2 模型基於 ChatML 進行訓練，提示結構如下：

<|im_start|>user
Hi there!<|im_end|>
<|im_start|>assistant
Nice to meet you!<|im_end|>
<|im_start|>user
Can I ask a question?<|im_end|>
<|im_start|>assistant

高級用法

文檔未提供高級用法示例，暫不展示。

上下文和指令

v0.2 模型基於 ChatML 進行訓練，請使用該上下文和指令模板。

當前頂級採樣器設置

Smooth Creativity：感謝 Juelsman 的研究！
Variant Chimera：感謝 Numbra！
Spicy_Temp
Violet_Twilight-Nitral-Special

🔧 技術細節

合併配置

以下配置用於合併 Azure Dusk 和 Crimson Dawn：

slices:
  - sources:
      - model: Epiculous/Azure_Dusk-v0.2
        layer_range: [0, 40]
      - model: Epiculous/Crimson_Dawn-V0.2
        layer_range: [0, 40]
merge_method: slerp
base_model: Epiculous/Azure_Dusk-v0.2
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5 # fallback for rest of tensors
dtype: bfloat16

📚 詳細文檔

評估結果

Open LLM Leaderboard 評估結果詳細結果可查看此處

指標	值
平均值	18.53
IFEval (0-Shot)	45.32
BBH (3-Shot)	23.94
MATH Lvl 5 (4-Shot)	2.72
GPQA (0-shot)	2.13
MuSR (0-shot)	13.61
MMLU-PRO (5-shot)	23.45

📄 許可證

本項目採用 Apache-2.0 許可證。

📋 模型信息

屬性	詳情
支持語言	英語、法語、德語、西班牙語、意大利語、葡萄牙語、俄語、中文、日語
模型類型	文本生成
訓練數據集	`Epiculous/SynthRP-Gens-v1.1-Filtered-n-Cleaned`、`anthracite-org/stheno-filtered-v1.1`、`PJMixers/hieunguyenminh_roleplay-deduped-ShareGPT`、`Gryphe/Sonnet3.5-Charcard-Roleplay`、`Epiculous/Synthstruct-Gens-v1.1-Filtered-n-Cleaned`、`anthracite-org/kalo-opus-instruct-22k-no-refusal`、`anthracite-org/nopm_claude_writing_fixed`、`anthracite-org/kalo_opus_misc_240827`
合併方法	SLERP
基礎模型	Epiculous/Azure_Dusk-v0.2
數據類型	bfloat16