D

Deepthought MOE 8X3B R1 Llama 3.2 Reasoning 18B Gguf

由DavidAU開發
一個8X3B的專家混合模型,激活了4/8個專家,每個模型都配備了推理技術,總參數為24B,但模型大小僅為18.4B。適用於創意和非創意用例以及通用用途。
下載量 148
發布時間 : 2/16/2025

模型概述

該模型由8個針對推理/思考微調的Llama 3.2 3B模型組成,適用於創意寫作、問題解決、頭腦風暴等任務。

模型特點

深度推理能力
模型能夠進行長鏈推理和深度思考,適用於複雜問題解決。
創意寫作支持
特別適合創意寫作,如小說、情節生成、角色扮演等。
專家混合架構
由8個微調的Llama 3.2 3B模型組成,可根據需求激活1到8個專家。
高溫度適應性
在高溫度設置下(1+、2+等)仍能保持連貫性,生成更豐富的思考內容。

模型能力

文本生成
推理
問題解決
創意寫作
頭腦風暴
解謎
小說寫作
情節生成
子情節生成
場景延續
角色扮演

使用案例

創意寫作
科幻小說創作
生成完全發生在宇宙飛船駕駛艙內的故事,探討孤立、犧牲和人類聯繫。
生成800-1000字的連貫故事,包含情感深度和情節發展。
愛情小說場景
生成一個發生在威爾士小鎮書店的愛情場景,包含未言明的化學反應。
生成800-1000字的對話豐富場景,角色有獨特聲音和情感層次。
問題解決
邏輯謎題解決
解決複雜的邏輯謎題和謎語,超出標準Llama 3.2模型能力範圍的問題。
提供逐步推理和解決方案,展示深度思考能力。
頭腦風暴
為新的'黑鏡'劇集想出六個涉及時間旅行的情節。
生成六個獨特且觀眾會喜歡的情節創意。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase