モデル選定

動的マスクアテンション

# 動的マスクアテンション

Doge 20M Chinese

Dogeモデルは動的マスクアテンションメカニズムを使用してシーケンス変換を行い、多層パーセプトロンまたはクロスドメインエキスパート混合を選択して状態変換を行うことができます。

大規模言語モデル

Transformers 複数言語対応

Doge 120M MoE Instruct

Dogeモデルは動的マスクアテンション機構を使用してシーケンス変換を行い、多層パーセプトロンまたはクロスドメイン混合エキスパートを使用して状態変換が可能です。

大規模言語モデル

Transformers 英語

Doge 320M Instruct

Doge 320M 指導版は動的マスクアテンションを基にした軽量言語モデルで、教師ありファインチューニング(SFT)と直接選好最適化(DPO)で訓練され、質問応答や対話タスクに適しています。

大規模言語モデル

Transformers 英語

Dogeは動的マスクアテンションメカニズムを採用したシーケンス変換モデルで、多層パーセプトロンまたはクロスドメインエキスパート混合を使用して状態変換を行います。

大規模言語モデル

Transformers 複数言語対応

Doge 160M Reason Distill

Doge 160M 推論蒸留版は、動的マスクアテンションメカニズムとクロスドメイン混合専門家に基づく軽量言語モデルで、推論と質問応答タスクに特化しています。

大規模言語モデル

Transformers 英語

Doge 160M Instruct

Doge 160Mは動的マスクアテンションメカニズムに基づく小型言語モデルで、教師あり微調整(SFT)と直接選好最適化(DPO)で訓練されています。

大規模言語モデル

Transformers 英語

Doge 160M は動的マスクアテンションメカニズムを採用した小型言語モデルで、SmallDoge コミュニティによってトレーニングされ、テキスト生成タスクをサポートします。

大規模言語モデル

Transformers 複数言語対応

Doge 20M Instruct

Doge 20Mは動的マスクアテンション機構に基づく小型言語モデルで、命令追従と質問応答タスクをサポートします。

大規模言語モデル

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase