D

Deepseek V3 0324 Fused 4E 29B Unhealed Preview

AlphaGaOによって開発
これは完全に訓練されていない実験的なモデルで、主に研究目的で使用され、モデル融合技術によって作成され、正常な機能を回復するには特定の修復プロセスが必要です。
ダウンロード数 167
リリース時間 : 4/8/2025

モデル概要

256個の専家に基づくDeepSeek-V3-0324モデルで、異なる圧縮レベルのプレビューバージョンを提供し、主にモデル融合と蒸留技術の研究に使用されます。

モデル特徴

モデル融合技術
専家融合技術により、モデルサイズを大幅に縮小(1/20 - 1/23に縮減)しながら、予想を超える性能を維持します。
多領域能力向上
MMLU - Pro、GPQA、AIMEなどの複数の基準テストで性能が大幅に向上します。
中国語能力強化
中国語の執筆スタイルと品質が向上し、複数回の対話式の書き直しをサポートし、翻訳と手紙の執筆が最適化されます。
コード生成改善
フロントエンドのウェブ開発能力が強化され、生成されるコードが実行しやすく、ページとゲームのフロントエンドがより美しくなります。
関数呼び出し最適化
以前のバージョンの関数呼び出しの問題を修正し、精度が向上します。

モデル能力

テキスト生成
コード生成
中国語執筆
ウェブ検索強化
関数呼び出し
JSON出力
FIM完了

使用事例

学術研究
モデル融合技術研究
モデル融合と蒸留技術の効果と改善の余地を研究します。
異なる圧縮レベルのモデルバリエーションを研究に提供します。
コンテンツ作成
中国語執筆支援
ユーザーが高品質の中国語コンテンツを生成するのを支援します。
R1執筆スタイルに合致し、中長編の執筆品質が向上します。
フロントエンド開発
ウェブコード生成
実行可能なフロントエンドのウェブコードを生成します。
コードの実行可能性が向上し、ページがより美しくなります。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase