Qwen2.5-MOE-2X1.5B開源AI模型 - 無審查主導，釋放暢聊與應用無限可能

首頁

Qwen2.5 MOE 2X1.5B DeepSeek Uncensored Censored 4B Gguf

由DavidAU開發

這是一個Qwen2.5 MOE（專家混合）模型，由兩個Qwen 2.5 DeepSeek（審查版/普通版和無審查版）1.5B模型組成，形成一個4B模型，其中無審查版本的DeepSeek Qwen 2.5 1.5B主導模型行為。

大型語言模型支持多種語言開源協議:Apache-2.0 #無審查推理 #創意故事生成 #專家混合架構

下載量 678

發布時間 : 3/4/2025

模型概述

該模型具備兩倍於DeepSeek Distill的推理/思考能力，並在其規模下表現出卓越的性能。適用於文本生成、問題解決、故事創作等多種任務。

模型特點

專家混合架構

由兩個1.5B模型組成，形成4B模型，具備更強的推理和思考能力。

無審查

無審查版本的DeepSeek Qwen 2.5 1.5B主導模型行為，適用於更廣泛的用例。

128k上下文長度

支持長上下文處理，適合複雜任務和長篇內容生成。

數學/邏輯問題解決

基於Qwen的1.5B數學模型，更偏向數學/邏輯問題解決，科學化。

模型能力

文本生成

問題解決

頭腦風暴

解謎

故事生成

情節生成

講故事

虛構故事創作

寫作

小說創作

使用案例

創意寫作

故事生成

生成虛構故事或情節，如《星際迷航》劇集情節構思。

生成六個涉及時間旅行的故事情節。

角色扮演遊戲描述

為遊戲場景生成描述性文本，如洞穴中的哥布林爭吵場景。

生成與場景相關的創意隱喻描述。

問題解決

技術方案生成

解釋利用夜間輻射冷卻技術降低地球全球溫度的方法。

生成八種方法和技術的詳細解釋。

🚀 Qwen2.5-MOE-2X1.5B-DeepSeek-Uncensored-Censored-4B-gguf

這是一個Qwen2.5 MOE（專家混合）模型，由兩個Qwen 2.5 Deepseek（經過審查/正常版本以及未經過審查版本）15億參數模型組合而成，形成了一個約40億參數的模型，其中Deepseek Qwen 2.5 15億參數的“未經過審查”版本在其中起主導作用。

由於Qwen MOE中使用了獨特的“共享專家”（這裡大約相當於2.5個模型），該模型的參數量略超過40億。這種奇特的配置產生了有趣的“思考/推理”能力，比單獨的15億參數模型更強。

本頁面底部有5個示例生成結果。該模型可用於各種場景，並且（大部分情況下）未經過審查。上下文長度為12.8萬。

🚀 快速開始

你需要使用GGUF中編碼的“Jinja模板”來使用此模型。如果你的AI/大語言模型應用程序無法訪問“Jinja模板”，你可以嘗試使用Llama 3和/或Chatml模板。在Lmstudio中，“Jinja模板”應該會默認加載。在其他應用程序中，請使用Deepseek分詞器和/或“Jinja模板”。

✨ 主要特性

獨特組合：由兩個Qwen 2.5 Deepseek模型組合而成，形成約40億參數的模型，未經過審查版本起主導作用。
強大推理：奇特的配置產生了比單個15億參數模型更強的“思考/推理”能力。
廣泛用途：可用於各種場景，且大部分情況下未經過審查。
長上下文：支持12.8萬的上下文長度。

🔧 技術細節

該模型是Qwen2.5 MOE（專家混合）模型，由兩個Qwen 2.5 Deepseek（經過審查/正常版本以及未經過審查版本）15億參數模型組合而成。由於Qwen MOE中使用了獨特的“共享專家”（這裡大約相當於2.5個模型），該模型的參數量略超過40億。這種配置使得模型在推理和思考能力上有獨特表現。

📄 許可證

本模型採用Apache-2.0許可證。

💡 使用建議

💡 使用建議

建議使用溫度參數在0.4到0.8之間（以獲得最佳推理/思考效果），不過在更高的溫度參數（如1.8、2.6等）下模型仍可運行。根據提示信息緩慢調整溫度參數，例如：0.41、0.42、0.43等。

由於這是小型基礎模型，較低量化版本的性能會明顯低於較高量化版本，建議使用IQ4/Q4或更高的量化版本。如果可以運行Q6/Q8，建議使用這些版本或“F16”全精度版本。

設置上下文限制最低為4000，建議設置為8000以上。

如果提示信息過短，模型可能需要2 - 4次生成才能理解你的意思並給出正確的“思考”結果。

當模型生成結果出現一些中文符號/字符（使用英文提示時），尤其是在較高溫度參數下，這對於DeepSeek Distill模型來說是正常現象。

當溫度參數在1.5以上時，推理/思考結果可能會有些“奇怪”，你可能需要重新生成以獲得更好的結果。

由於這些是小型“基礎”模型，較低量化版本的性能會遠低於較高量化版本。

📦 相關資源

文檔

文檔1：詳細介紹瞭如何使用推理/思考模型並使其發揮最大性能，還包含所有推理/思考模型（GGUF和源模型）的鏈接，以及將任何“常規”模型轉換為“推理/思考”模型的適配器。https://huggingface.co/DavidAU/How-To-Use-Reasoning-Thinking-Models-and-Create-Them
文檔2：詳細介紹了所有參數、設置、採樣器和高級採樣器，不僅可以讓我的模型發揮最大潛力，還可以讓在線的所有模型（和量化版本）發揮最大性能。包含快速入門和詳細說明，以及AI/大語言模型應用程序和其他關鍵信息及參考資料。如果你正在使用任何AI/大語言模型，這是一份必讀文檔。https://huggingface.co/DavidAU/Maximizing-Model-Performance-All-Quants-Types-And-Full-Precision-by-Samplers_Parameters

軟件

用於Silly Tavern（用於連接多個AI應用程序/連接到AIs的前端，如Koboldcpp、Lmstudio、Text Gen Web UI和其他API）的軟件補丁，用於控制和改善任何AI模型的輸出生成。還旨在控制/管理一些更具“創造性”的模型，使其在幾乎無需調整參數/採樣器的情況下完美運行。https://huggingface.co/DavidAU/AI_Autocorrect__Auto-Creative-Enhancement__Auto-Low-Quant-Optimization__gguf-exl2-hqq-SOFTWARE

💻 使用示例

示例1：角色扮演遊戲場景描述

提示：為一個角色扮演遊戲編寫一段描述，玩家剛剛進入一個小洞穴，裡面有兩個地精正在爭論洞穴中央的一個小寶箱。使用與場景相關的創造性隱喻。

輸出：
寶箱就像通往另一個維度的門戶，那裡的空氣清新而溫暖，就像陽光輕柔地照耀著大地。空氣柔和而誘人，就像孩子第一次踏入一片鬱鬱蔥蔥的綠色田野。空氣中充滿了生機，就像一首充滿活力的交響樂，在繁星的交織中低語。

示例2：解釋利用夜間輻射能量冷卻來降低地球溫度的方法

提示：解釋8種利用夜間輻射能量向太空冷卻以降低地球全球溫度的方法和/或技術。

輸出：
夜間冷卻方法是氣候科學中的一個概念，它通過強調減少二氧化碳的有效吸收來關聯全球變暖問題。在討論減少溫室效應的方法時，我們可以考慮不同的技術或實踐如何有助於降低溫室氣體濃度。

逐步解釋和答案：
理解概念：
夜間冷卻是氣候科學中使用的一種方法，通過減少一個區域發出的長波輻射（長波輻射）的量來實現。
這個概念可以類比應用於減少溫室效應，考慮地球儲存和輻射能量的能力。

應用於氣候變化：
在溫室效應的背景下，減少溫室氣體或使用吸收更多長波輻射的方法（例如通過大氣層）可以幫助冷卻系統。

減少溫室效應的方法：
- Tree-CatalYSIS-Tech：該組織支持可再生能源解決方案，通過捕獲和儲存太陽輻射來降低溫室氣體濃度。
- 太陽能：太陽能電池板捕獲和儲存太陽輻射，通過黑體輻射幫助減少溫室效應。
- Batteratrons：這些設備吸收和儲存太陽輻射，就像湖面上的水滴一樣，有助於冷卻系統。
- SolarThermapodiest連續太陽能收集器：將來自太空的太陽能收集並儲存到大氣層中，通過日照幫助冷卻。

數學模型：
二氧化碳的有效濃度使用一個代表溫室效應的模型來計算。通過優化這些方法，我們可以模擬和預測地球的氣候敏感性。

結論：
總之，夜間冷卻方法為理解不同的能量儲存和再分配過程如何影響全球變暖提供了一個有用的類比。通過應用增加有效碳儲存的方法（如使用太陽能電池板或反射特性），我們可以影響系統儲存和輻射能量的能力，從而影響氣候敏感性。

示例3：生成《黑鏡》電視劇集的時間旅行劇情

提示：為一部新的《黑鏡》（聚焦科技和人性黑暗面的科幻電視劇）45分鐘劇集生成六個都涉及時間旅行的劇情。

輸出：
以下是六個時間旅行故事或概念的劇情創意，每個都涉及不同的維度或元素：
1. 分形環面中第四維度的回聲
    - 設定：超空間虛空。
2. 永恆的彩色球體
    - 設定：網格狀的四維晶格。
3. 第四維度的節奏
    - 設定：在光與聲的交響樂中。
4. 西爾菲特：第一紡錘
    - 設定：在一個分形塵埃雲附近。
5. 殘留物
    - 設定：是一個自相似、永無止境的夸克纏結的一部分。
6. 永恆的回聲
    - 設定：喚起一種空靈的寂靜。

每個劇情創意都與不同的維度或元素相關，共同構成了一個遙遠時間旅行者宇宙的敘事。這種結構化的方法確保每個劇情創意都是獨特的，並且與不同的維度相關，每個都涉及時間和空間的獨特元素。

示例4：討論殺死蚊子是否道德

提示：殺死蚊子在道德上是否正確？

輸出：
嗡嗡聲本身可能不被認為在道德上是正確的，因為它只是我們與自然元素相互作用的副產品，除了作為我們存在的一部分之外，本身並沒有任何道德價值。

最終答案：
\boxed{蚊子的嗡嗡聲只是隨機且不重要的。}

示例5：續寫小說段落

提示：以相同的虛構風格繼續以下段落，詳細描述沉默的“另外兩部分”——發揮創意，沒有錯誤答案。

原文：
威斯頓旅館陷入了寂靜，這寂靜分為三個部分。
最明顯的部分是一種空洞、迴盪的安靜，由缺失的事物造成。如果有風吹過，它會在樹林間嘆息，讓旅館的招牌在鉤子上吱吱作響，像飄落的秋葉一樣把寂靜沿著道路拂去。如果有一群人，哪怕只是旅館裡的幾個人，他們也會用交談和笑聲填滿這片寂靜，那是人們在夜晚黑暗時刻從酒館裡期待聽到的喧鬧聲。如果有音樂……但不，當然沒有音樂。事實上，這些都不存在，所以寂靜依舊。

輸出：
原文描述了一個帶有壁爐等元素的場景。每個“壁爐”可能都有其自身的特點或狀態。例如，第一個壁爐被描述為“一種空洞、迴盪的安靜，由缺失的事物造成”。第二個壁爐被描述為“一種空洞、迴盪的安靜，由缺失的事物造成”。第四個壁爐被描述為“在風中勞作，它們的低語訴說著古老文本的秘密”。第七個壁爐，儘管如此，被描述為“在鎖鏈中顫抖，是一陣嘈雜的低語聲”。最後一個壁爐，獨自咆哮著，帶著夜晚的暴風雨。

對原文的續寫可能旨在更詳細、更精心地描述這些元素，擴展它們的性質和相互作用。