モデル選定

モデル蒸留

# モデル蒸留

DMMはスコア蒸留に基づくモデル融合パラダイムで、複数の異なるドメインの事前学習済みモデルを1つの多機能テキストから画像生成モデルに圧縮します。

Deepseek R1 Distill Qwen 32B Lora R32

これはDeepSeek-R1-蒸留-Qwen-32Bから抽出されたLoRAアダプターで、Qwen2.5-32Bベースモデルに基づいており、パラメータ効率的なファインチューニングに適しています。

大規模言語モデル

Distilbart Mnli 12 3

DistilBart-MNLI は bart-large-mnli の蒸留バージョンで、教師なし蒸留技術を採用し、性能はオリジナルモデルに近いがより軽量です。

テキスト分類

Tiny Bert Sst2 Distilled

これはTiny BERTアーキテクチャに基づくテキスト分類モデルで、GLUEのSST - 2データセットで微調整され、感情分析タスクに使用されます。

テキスト分類

Distilbart Mnli 12 9

DistilBart - MNLIは、教師なし蒸留技術を用いてbart - large - mnliから蒸留された軽量版で、高い精度を維持しながらモデルの複雑さを減らしています。

テキスト分類

Distilbart Mnli 12 6

DistilBart-MNLI は BART-large-MNLI の蒸留バージョンで、教師なし蒸留技術を採用し、高性能を維持しながらモデルサイズを大幅に削減しています。

テキスト分類

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase