Qwen3 4B Esper3
Apache-2.0
エスパー3はQwen3をベースに構築されたコーディング、アーキテクチャ、DevOps推論の専門モデルで、ローカルおよびサーバー展開に適しています。
大規模言語モデル
Transformers 複数言語対応

Q
ValiantLabs
4,951
7
GLM 4 32B 0414 Bnb 4bit
MIT
GLM-4-32B-0414はGLMファミリーの新メンバーで、320億パラメータ規模を有し、GPTシリーズやDeepSeek-V3シリーズに匹敵する性能を持ち、ローカル展開をサポートします。
大規模言語モデル
Transformers 複数言語対応

G
unsloth
41
2
GLM 4 32B 0414 Unsloth Bnb 4bit
MIT
GLM-4-32B-0414はGLMファミリーの新メンバーで、320億のパラメータを持ち、GPTシリーズやDeepSeekシリーズに匹敵する性能を発揮し、ローカルデプロイをサポートします。
大規模言語モデル
Transformers 複数言語対応

G
unsloth
87
2
GLM 4 32B 0414
MIT
GLM-4-32B-0414はGLMファミリーの新メンバーで、パラメータ規模は320億に達し、GPT-4oやDeepSeek-V3などと同等の性能を持ち、ローカル展開をサポートしています。
大規模言語モデル
Transformers 複数言語対応

G
unsloth
101
3
Deepseek Coder V2 Lite Base AWQ
その他
DeepSeek-Coder-V2はオープンソースの混合専門家(MoE)コード言語モデルで、特定のコードタスクではGPT4-Turboに匹敵する性能を実現します。
大規模言語モデル
Transformers

D
TechxGenus
229.29k
2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98