D

Deepseek V3 0324 Fused 4E 29B Unhealed Preview

由AlphaGaO開發
這是一個未經過完整訓練的實驗性模型,主要用於研究目的,通過模型融合技術創建,需要特定修復流程才能恢復正常功能。
下載量 167
發布時間 : 4/8/2025

模型概述

基於256個專家的DeepSeek-V3-0324模型,提供不同壓縮級別的預覽版本,主要用於研究模型融合和蒸餾技術。

模型特點

模型融合技術
通過專家融合技術顯著減小模型大小(縮減至1/20-1/23),同時保持超出預期的性能表現
多領域能力提升
在MMLU-Pro、GPQA、AIME等多個基準測試中性能顯著提升
中文能力增強
中文寫作風格和質量提升,支持多輪交互式重寫,翻譯和書信寫作優化
代碼生成改進
前端網頁開發能力增強,生成的代碼更易執行,頁面和遊戲前端更美觀
函數調用優化
修復了之前版本的函數調用問題,準確性提高

模型能力

文本生成
代碼生成
中文寫作
網頁搜索增強
函數調用
JSON輸出
FIM完成

使用案例

學術研究
模型融合技術研究
研究模型融合和蒸餾技術的效果和改進空間
提供不同壓縮級別的模型變體供研究
內容創作
中文寫作輔助
幫助用戶生成高質量的中文內容
符合R1寫作風格,中長篇寫作質量更好
前端開發
網頁代碼生成
生成可執行的前端網頁代碼
代碼可執行性提高,頁面更美觀
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase