Doge - 20M - Chineseオープンソースモデル - シーケンス及び状態変換を支援し、多様なアプリケーションの潜在力を解放！

ホーム

Doge 20M Chinese

wubinghengによって開発

Dogeモデルは動的マスクアテンションメカニズムを使用してシーケンス変換を行い、多層パーセプトロンまたはクロスドメインエキスパート混合を選択して状態変換を行うことができます。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #動的マスクアテンション #中国語テキスト生成 #小型言語モデル

ダウンロード数 65

リリース時間 : 4/11/2025

モデル概要

Dogeモデルは中国語テキスト生成モデルで、動的マスクアテンションメカニズムを採用し、トレーニングと推論時に異なる状態変換メカニズムを切り替えることができます。

モデル特徴

動的マスクアテンションメカニズム

Transformerがトレーニング時に自己アテンションメカニズムを使用し、推論時に状態空間メカニズムに切り替えることができます。

クロスドメインエキスパート混合

多層パーセプトロンの重みを直接継承して後続のトレーニングを行うことができます。

モデル能力

中国語テキスト生成

使用事例

テキスト生成

対話生成

自然言語対話を生成するために使用されます

🚀 Doge 20M CN

DogeはDynamic Mask Attentionをシーケンス変換に使用し、Multi-Layer PerceptronまたはCross Domain Mixture of Expertsを状態変換に使用できます。Dynamic Mask Attentionにより、Transformerはトレーニング中にセルフアテンションを、推論中に状態空間を使用できます。また、Cross Domain Mixture of ExpertsはMulti-Layer Perceptronの重みを直接引き継いでさらなるトレーニングを行うことができます。このモデルはSmallDogeコミュニティによってトレーニングされています。詳細なアルゴリズムとモデルアーキテクチャについては、近日論文が公開されます。すべてのトレーニング詳細とコードはsmall-dogeリポジトリで入手できます。

🚀 クイックスタート

このセクションでは、Doge 20M CNモデルを使用するための基本的な手順を説明します。

✨ 主な機能

DogeはDynamic Mask Attentionをシーケンス変換に使用し、Multi-Layer PerceptronまたはCross Domain Mixture of Expertsを状態変換に使用できます。
Dynamic Mask Attentionにより、Transformerはトレーニング中にセルフアテンションを、推論中に状態空間を使用できます。
Cross Domain Mixture of ExpertsはMulti-Layer Perceptronの重みを直接引き継いでさらなるトレーニングを行うことができます。

💻 使用例

基本的な使用法

>>> from transformers import AutoTokenizer, AutoModelForCausalLM

>>> tokenizer = AutoTokenizer.from_pretrained("wubingheng/Doge-20M-Chinese")
>>> model = AutoModelForCausalLM.from_pretrained("wubingheng/Doge-20M-Chinese", trust_remote_code=True)
>>> inputs = tokenizer("你好", return_tensors="pt")

>>> out = model.generate(**inputs, max_new_tokens=100)
>>> print(tokenizer.batch_decode(out))

📚 ドキュメント

モデル詳細

環境:

イメージ: nvcr.io/nvidia/pytorch:24.12-py3
ハードウェア: 1x NVIDIA RTX 4090
ソフトウェア: Transformers

📄 ライセンス

このプロジェクトはApache-2.0ライセンスの下で公開されています。詳細については、ライセンスファイルを参照してください。

📚 引用

@misc{smalldoges,
  title={SmallDoges: A Family of Dynamic UltraFast Small Language Models}, 
  author={Jingze, Shi and Yifan, Wu and Bingheng, Wu and Yuyu, Luo},
  year={2025},
  month={March},
  url={https://github.com/SmallDoges/small-doge}
}