# 軽量級推論

Baidu ERNIE 4.5 0.3B PT GGUF
Apache-2.0
百度ERNIE-4.5-0.3B-PTモデルに基づく量子化バージョンで、llama.cppツールを通じて最適化され、モデルサイズを削減し、実行効率を向上させます。
大規模言語モデル 複数言語対応
B
bartowski
314
3
Deepseek Ai DeepSeek R1 Distill Qwen 14B GGUF
DeepSeek-R1-Distill-Qwen-14Bは、14Bパラメータ規模の最適化された大規模言語モデルで、DeepSeek AIによってリリースされ、Qwenアーキテクチャに基づいて蒸留され、性能向上のために複数のGGUF量子化バージョンを提供します。
大規模言語モデル
D
featherless-ai-quants
237
1
Gemma 3 4b It Abliterated GGUF
このモデルはmlabonne/gemma-3-4b-it-abliteratedをベースに変換されたGGUF形式のバージョンで、ローカルでの実行と推論に適しています。
大規模言語モデル Transformers
G
matrixportal
245
0
Gemma 3 1b It Abliterated GGUF
mlabonne/gemma-3-1b-it-abliteratedをベースに変換されたGGUF形式のモデルで、ローカル推論タスクに適しています。
大規模言語モデル Transformers
G
matrixportal
333
0
Qwen2 VL 7B GGUF
Apache-2.0
Qwen2-VL-7Bは視覚言語モデルで、複数の量子化バージョンのGGUF形式のモデルファイルを提供し、llama.cppでの使用に適しています。
テキスト生成画像 Transformers 英語
Q
tensorblock
108
1
Sbert Pq
sentence - transformersに基づくモデルで、短テキストと質問の間の関連性を判断するために使用されます。
テキスト埋め込み Transformers その他
S
inkoziev
268
17
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase