Qwen3 8B GGUF
Apache-2.0
Qwen3は通義千問シリーズの最新世代大規模言語モデルで、密モデルと混合エキスパート(MoE)モデルの完全なスイートを提供します。大規模なトレーニングに基づき、Qwen3は推論能力、命令追従、エージェント機能、多言語サポートにおいて画期的な進歩を実現しました。
大規模言語モデル 英語
Q
prithivMLmods
1,222
1
Qwen3 4B GGUF
Apache-2.0
Qwen3は通義千問シリーズの最新世代大規模言語モデルで、完全な密モデルと混合エキスパート(MoE)モデルの組み合わせを提供します。大規模なトレーニングに基づき、Qwen3は推論能力、命令追従、エージェント機能、多言語サポートにおいて画期的な進歩を実現しました。
大規模言語モデル 英語
Q
prithivMLmods
829
1
Qwen3 235B A22B
Apache-2.0
Qwen3はQwenシリーズ最新世代の大規模言語モデルで、一連の高密度および混合エキスパート(MoE)モデルを提供します。広範なトレーニングに基づき、Qwen3は推論、指示追従、エージェント能力、多言語サポートにおいて画期的な進歩を遂げました。
大規模言語モデル
Transformers

Q
unsloth
421
2
Qwen3 235B A22B GGUF
Apache-2.0
Qwen3はQwenシリーズの最新世代の大規模言語モデルで、一連の高密度および混合エキスパート(MoE)モデルを提供します。広範なトレーニングに基づき、Qwen3は推論、指示遵守、エージェント能力、多言語サポートにおいて画期的な進歩を実現しました。
大規模言語モデル 英語
Q
unsloth
75.02k
48
Qwen3 30B A3B Base
Apache-2.0
Qwen3-30B-A3B-Baseは通義千問シリーズ最新世代の30.5Bパラメータ規模の混合エキスパート(MoE)大規模言語モデルで、119言語と32kの文脈長をサポートします。
大規模言語モデル
Transformers

Q
Qwen
9,745
33
L3 SnowStorm V1.15 4x8B B
実験的なロールプレイ指向の混合エキスパートモデルで、ロールプレイ/感情ロールプレイタスクにおいてMixtral 8x7Bおよびそのファインチューニングバージョンに劣らない、あるいは優れたパフォーマンスを発揮することを目標としています。
大規模言語モデル
Transformers 英語

L
xxx777xxxASD
26
11
Snowflake Arctic Base
Apache-2.0
スノーフレーク・アークティックは、Snowflake AI研究チームによって開発された高密度混合エキスパート(MoE)アーキテクチャの大規模言語モデルで、4800億のパラメータを持ち、効率的なテキストおよびコード生成のために設計されています。
大規模言語モデル
Transformers

S
Snowflake
166
67
Snowflake Arctic Instruct
Apache-2.0
ArcticはSnowflake AIリサーチチームによって開発された高密度混合エキスパート(MoE)アーキテクチャの大規模言語モデルで、4800億のパラメータを持ち、Apache-2.0ライセンスでオープンソース化されています。
大規模言語モデル
Transformers

S
Snowflake
10.94k
354
Copus 2x8B
Copus-2x8B は Llama-3-8B アーキテクチャを基にした混合エキスパートモデルで、dreamgen/opus-v1.2-llama-3-8b と NousResearch/Meta-Llama-3-8B-Instruct の2つのファインチューニングバージョンを組み合わせています。
大規模言語モデル
Transformers

C
lodrick-the-lafted
14
1
Zephyr Orpo 141b A35b V0.1 GGUF
Apache-2.0
Mixtral-8x22B-v0.1をファインチューニングした1410億パラメータの混合エキスパートモデル(MoE)、活性化パラメータ350億、主に英語テキスト生成タスク用
大規模言語モデル 英語
Z
MaziyarPanahi
10.04k
29
Phalanx 512x460M MoE
Apache-2.0
LiteLlama-460M-1Tは軽量な混合エキスパートモデルで、512のエキスパートを含み、効率的な推論とテキスト生成タスクに適しています。
大規模言語モデル
Transformers 英語

P
Kquant03
28
2
Laser Dolphin Mixtral 2x7b Dpo
Apache-2.0
Dolphin-2.6-Mistral-7B-DPO-Laserをベースにした中規模混合エキスパート(MoE)実装で、評価性能が平均約1ポイント向上
大規模言語モデル
Transformers

L
macadeliccc
133
57
Phixtral 2x2 8
MIT
phixtral-2x2_8 は、2つの microsoft/phi-2 モデルを基に構築された初の混合エキスパートモデル(MoE)であり、個々のエキスパートモデルよりも優れたパフォーマンスを発揮します。
大規模言語モデル
Transformers 複数言語対応

P
mlabonne
178
148
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98