D

Doge 320M

Developed by SmallDoge
Doge是一個採用動態掩碼注意力機制進行序列轉換的模型,可使用多層感知器或跨域專家混合進行狀態轉換。
Downloads 3,028
Release Time : 3/10/2025

Model Overview

Doge模型由SmallDoge社區訓練,支持文本生成任務,採用動態掩碼注意力機制,在訓練時使用自注意力機制,在推理時使用狀態空間機制。

Model Features

動態掩碼注意力機制
允許Transformer在訓練時使用自注意力機制,在推理時使用狀態空間機制。
跨域專家混合
可直接繼承多層感知器的權重進行進一步訓練。
高效訓練
在RTX 4090 GPU上進行了高效訓練,訓練時間相對較短。

Model Capabilities

文本生成
序列轉換

Use Cases

自然語言處理
對話生成
可用於生成自然語言對話響應。
生成流暢的對話內容
內容創作
可用於輔助寫作和內容創作。
生成連貫的文本內容
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase