D

Doge 20M Chinese

wubinghengによって開発
Dogeモデルは動的マスクアテンションメカニズムを使用してシーケンス変換を行い、多層パーセプトロンまたはクロスドメインエキスパート混合を選択して状態変換を行うことができます。
ダウンロード数 65
リリース時間 : 4/11/2025

モデル概要

Dogeモデルは中国語テキスト生成モデルで、動的マスクアテンションメカニズムを採用し、トレーニングと推論時に異なる状態変換メカニズムを切り替えることができます。

モデル特徴

動的マスクアテンションメカニズム
Transformerがトレーニング時に自己アテンションメカニズムを使用し、推論時に状態空間メカニズムに切り替えることができます。
クロスドメインエキスパート混合
多層パーセプトロンの重みを直接継承して後続のトレーニングを行うことができます。

モデル能力

中国語テキスト生成

使用事例

テキスト生成
対話生成
自然言語対話を生成するために使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase