モデル選定

マルチタスク蒸留

# マルチタスク蒸留

Deepseek R1 Distill Qwen 32B Unsloth Bnb 4bit

DeepSeek-R1はDeepSeekチームによって開発された初代推論モデルで、大規模な強化学習トレーニングを通じて、教師付き微調整（SFT）を最初のステップとせずに、卓越した推論能力を発揮します。

大規模言語モデル

Transformers 英語

Theia Base Patch16 224 Cddsv

テイアはロボット学習向けの視覚基盤モデルで、複数の視覚基盤モデルを蒸留することで豊富な視覚表現能力を獲得しています

Xtremedistil L6 H384 Uncased

XtremeDistilTransformersは、知識蒸留を行った軽量Transformerモデルで、タスク非依存性を持ち、様々な自然言語処理タスクに適用できます。

大規模言語モデル英語

Xtremedistil L6 H256 Uncased

XtremeDistilTransformersは蒸留されたタスク非依存型Transformerモデルで、タスク転移学習技術を用いて訓練された小型汎用モデルであり、様々なタスクと言語に適用可能です。

大規模言語モデル

Transformers 英語

Xtremedistil L12 H384 Uncased

XtremeDistilTransformersは蒸留されたタスク非依存のTransformerモデルで、タスク転移学習により小型汎用モデルを実現し、あらゆるタスクと言語に適用可能です。

大規模言語モデル

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase