Qwen3 128k 30B A3B NEO MAX Imatrix Gguf
Apache-2.0
Qwen3-30B-A3B混合専門家モデルのGGUF量子化バージョンで、コンテキストを128kに拡張し、NEO Imatrix量子化技術を採用して最適化され、多言語および多タスク処理をサポートします。
大規模言語モデル 複数言語対応
Q
DavidAU
17.20k
10
Qwen3 32B 128k NEO Imatrix Max GGUF
Apache-2.0
これはQwen3-32BモデルのNEO Imatrix量子化バージョンで、BF16フォーマットを使用して出力テンソルを最大化し、推論/生成能力を向上させ、128kのコンテキスト長をサポートします。
大規模言語モデル
Q
DavidAU
1,437
2
Qwen3 32B 128k HORROR Imatrix Max GGUF
Apache-2.0
Qwen3-32Bをベースに最適化されたホラーテーマのテキスト生成モデル。Imatrix量子化技術で推論能力を強化し、128kの超長コンテキストをサポート
大規模言語モデル
Q
DavidAU
1,963
2
Mistral Small 3.1 24B Instruct 2503 MAX NEO Imatrix GGUF
Apache-2.0
Mistralaiが提供する24Bパラメータの命令微調整モデルで、128kのコンテキスト長と多言語処理をサポートし、Neo Imatrix技術とMAX量子化スキームにより性能を向上
大規模言語モデル 複数言語対応
M
DavidAU
38.29k
31
Gemma 3 12b It MAX HORROR Imatrix GGUF
Apache-2.0
GoogleのGemma-3モデルを基にしたホラースタイルの命令微調整バージョン、Neo Imatrix技術と究極の量子化スキームを採用、128kコンテキスト長をサポート
大規模言語モデル
G
DavidAU
5,072
13
Llama 3.3 70b Instruct Awq
Llama 3.3はMetaが開発した多言語大規模言語モデルで、700億のパラメータを持ち、多言語対話ユースケースに最適化されており、多くのベンチマークテストで優れた性能を発揮します。
大規模言語モデル
Transformers 複数言語対応

L
casperhansen
47.12k
32
Llama 3.2 3B Instruct NEO SI FI GGUF
Apache-2.0
Llama-3.2アーキテクチャに基づく3Bパラメータの命令微調整モデルで、NEO IMATRIX SFデータセットを統合し、128kの長いコンテキスト生成をサポート
大規模言語モデル 複数言語対応
L
DavidAU
725
8
Llama 3.1 405B Instruct FP8
Meta Llama 3.1は多言語大規模言語モデルシリーズで、8B、70B、405B規模の事前学習および命令調整生成モデルを含みます。405Bバージョンは多言語対話シナリオ向けに最適化されており、一般的な業界ベンチマークテストで優れた性能を発揮します。
大規模言語モデル
Transformers 複数言語対応

L
meta-llama
7,406
188
Llama 3.1 70B Instruct
Meta Llama 3.1 は80億、700億、4050億パラメータを含む事前学習及び命令調整生成モデル群で、多言語対話シーン向けに最適化され、8言語とコード生成をサポートします。
大規模言語モデル
Transformers 複数言語対応

L
meta-llama
1.2M
806
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98