Qwen3 235B A22B FP8 Dynamic
Apache-2.0
Qwen3-235B-A22BモデルのFP8量子化バージョンで、GPUメモリの要件を効果的に削減し、計算スループットを向上させ、さまざまな自然言語処理シナリオに適しています。
大規模言語モデル
Transformers

Q
RedHatAI
2,198
2
Qwen3 14B FP8 Dynamic
Apache-2.0
Qwen3-14B-FP8-dynamicは最適化された大規模言語モデルで、活性化値と重みをFP8データ型に量子化することで、GPUメモリの要件を効果的に削減し、計算スループットを向上させます。
大規模言語モデル
Transformers

Q
RedHatAI
167
1
Llama 3.2 1B Instruct Q4 K M GGUF
これはMeta Llama-3.2-1B-Instructモデルを変換したGGUF形式の定量版で、ローカル推論シナリオに適しています。
大規模言語モデル 複数言語対応
L
hugging-quants
24.70k
16
Mixtral 8x22B Instruct V0.1 GGUF
Apache-2.0
mistralai/Mixtral-8x22B-Instruct-v0.1モデルに基づくGGUF量子化バージョンで、多言語テキスト生成タスクをサポートします。
大規模言語モデル 複数言語対応
M
MaziyarPanahi
1,333
33
Tamil Llama 7b Instruct V0.1
これはLLaMA-2を強化した70億パラメータのタミル語大規模言語モデルで、タミル語と英語のテキスト生成タスクをサポートします。
大規模言語モデル
Transformers 複数言語対応

T
abhinand
2,461
8
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98