DeepSeek-R1T-Chimeraオープンソースウェイトモデル - ダブルバージョンの優位性を融合し、スマートで効率的な価値を解放する

ホーム

Deepseek R1T Chimera

tngtechによって開発

DeepSeek-R1T-Chimeraは、DeepSeek-R1の知能とDeepSeek-V3のトークン効率を組み合わせたオープンソースの重み付けモデルです。

大規模言語モデル

Transformers

オープンソースライセンス:MIT #モデル融合 #効率的なトークン処理 #インテリジェントなテキスト生成

ダウンロード数 491

リリース時間 : 4/26/2025

モデル概要

このモデルはDeepSeek-R1とDeepSeek-V3(0324)のモデル重みを融合し、より効率的なテキスト生成能力を提供することを目的としています。

モデル特徴

モデル融合

DeepSeek-R1の知能とDeepSeek-V3のトークン効率を組み合わせています

オープンソースの重み付け

研究や応用に便利なオープンソースのモデル重みを提供します

モデル能力

テキスト生成

使用事例

テキスト生成

コンテンツ作成

高品質なテキストコンテンツの生成に使用されます

属性	详情
アーキテクチャ	DeepSeek-MoE Transformerベースの言語モデル
結合方法	DeepSeek-R1とDeepSeek-V3 (0324) のモデルウェイトをマージ
リリース日	2025-04-27

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Deepseek R1T Chimera

モデル概要

モデル特徴

モデル能力

使用事例

🚀 DeepSeek-R1T-Chimera

📚 ドキュメント

モデルの詳細

使用方法、範囲外の使用、制限事項、リスク、推奨事項等

お問い合わせ

引用

📄 ライセンス