D

Doge 20M Chinese

由wubingheng開發
Doge模型採用動態掩碼注意力機制進行序列轉換,可選擇多層感知機或跨域專家混合進行狀態轉換。
下載量 65
發布時間 : 4/11/2025

模型概述

Doge模型是一箇中文文本生成模型,採用動態掩碼注意力機制,支持在訓練和推理時切換不同的狀態轉換機制。

模型特點

動態掩碼注意力機制
使Transformer能在訓練時使用自注意力機制,在推理時切換至狀態空間機制。
跨域專家混合
可直接繼承多層感知機的權重進行後續訓練。

模型能力

中文文本生成

使用案例

文本生成
對話生成
用於生成自然語言對話
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase