Qwen3 30B A6B 16 Extreme 128k Context
千問3-30B-A3Bをベースにした混合専門家モデルの微調整版で、活性化専門家数を16に増加、コンテキストウィンドウを128kに拡張し、複雑な推論シナリオに適しています
大規模言語モデル
Transformers

Q
DavidAU
72
7
GLM 4 32B 0414 Unsloth Bnb 4bit
MIT
GLM-4-32B-0414はGLMファミリーの新メンバーで、320億のパラメータを持ち、GPTシリーズやDeepSeekシリーズに匹敵する性能を発揮し、ローカルデプロイをサポートします。
大規模言語モデル
Transformers 複数言語対応

G
unsloth
87
2
GLM 4 32B 0414
MIT
GLM-4-32B-0414は320億パラメータ規模の大規模言語モデルで、GPTシリーズと同等の性能を持ち、中国語と英語をサポートし、コード生成、関数呼び出し、複雑なタスク処理に優れています。
大規模言語モデル
Transformers 複数言語対応

G
THUDM
10.91k
320
Community Request 02 12B
複数の12Bパラメータ規模の大規模言語モデルを融合したもので、テキスト生成と対話能力を備えています
大規模言語モデル
Transformers

C
Nitral-AI
53
4
Community Request 01 12B
複数のCaptain-Erisシリーズモデルをmergekitツールで統合した事前学習言語モデル
大規模言語モデル
Transformers

C
Nitral-AI
19
3
Badger Lambda Llama 3 8b
Badgerは再帰的最大ペアワイズ非交和正規化ノイズ除去フーリエ補間法によって生成されたLlama3 8B命令モデルで、複数の優れたモデルの特性を融合しています。
大規模言語モデル
Transformers

B
maldv
24
11
Kunoichi DPO V2 7B
Kunoichi-DPO-v2-7BはMistralアーキテクチャを基にした70億パラメータの大規模言語モデルで、DPO(Direct Preference Optimization)を用いて最適化訓練されており、複数のベンチマークテストで優れた性能を発揮しています。
大規模言語モデル
Transformers

K
SanjiWatsuki
185
86
Tulu 65b
Tulu 650億はマルチインストラクションデータセットでファインチューニングされた650億パラメータのLLaMaモデルで、オープンリソースのインストラクションチューニング研究の成果であり、総合性能が強力です。
大規模言語モデル
Transformers 英語

T
allenai
20
21
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98