# CPU高效推理

Josiefied Qwen3 8B Abliterated V1 GGUF
基於Qwen3-8B的量化版本,採用IQ-DynamicGate超低位量化技術,優化內存效率和推理速度
大型語言模型
J
Mungert
559
1
GLM Z1 9B 0414 GGUF
MIT
GLM-Z1-9B-0414 是一個支持中英雙語的文本生成模型,採用 GGUF 格式,適用於多種量化級別,從 BF16 到超低位量化(1-2 比特)。
大型語言模型 支持多種語言
G
Mungert
1,598
3
Olympiccoder 7B GGUF
Apache-2.0
OlympicCoder-7B是基於Qwen2.5-Coder-7B-Instruct優化的代碼生成模型,採用IQ-DynamicGate超低比特量化技術,專為內存受限環境設計。
大型語言模型 英語
O
Mungert
849
3
GLM 4 32B 0414 GGUF
MIT
GLM-4-32B-0414 GGUF模型是一系列強大的文本生成模型,具有多種量化格式,適用於不同硬件和內存條件。
大型語言模型 Transformers 支持多種語言
G
Mungert
817
4
Deepcoder 14B Preview GGUF
MIT
採用IQ-DynamicGate技術的超低位量化(1-2比特)模型,適用於內存受限設備和邊緣計算場景
大型語言模型 英語
D
Mungert
1,764
6
Orpheus 3b 0.1 Ft GGUF
Apache-2.0
基於Llama-3-8B架構優化的超低比特量化模型,採用IQ-DynamicGate技術實現1-2比特精度自適應量化,適用於內存受限環境。
大型語言模型 英語
O
Mungert
1,427
1
Llama 3.1 Nemotron Nano 8B V1 GGUF
其他
基於Llama-3架構的8B參數模型,採用IQ-DynamicGate超低比特量化技術優化內存使用
大型語言模型 英語
L
Mungert
2,088
4
Mistral Small 3.1 24B Instruct 2503 GGUF
Apache-2.0
這是一個基於 Mistral-Small-3.1-24B-Base-2503 的指令微調模型,採用 GGUF 格式和 IQ-DynamicGate 超低比特量化技術。
大型語言模型 支持多種語言
M
Mungert
10.01k
7
Llama 3.1 8B Instruct GGUF
Llama-3.1-8B-Instruct 是基於 Llama-3-8B 的指令調優版本,採用 IQ-DynamicGate 技術進行超低位量化(1-2 比特),在保持內存效率的同時提升準確性。
大型語言模型 支持多種語言
L
Mungert
1,073
3
Mistral 7B Instruct V0.2 GGUF
Apache-2.0
Mistral-7B-Instruct-v0.2是基於Mistral-7B架構的指令微調模型,支持文本生成任務,採用IQ-DynamicGate超低比特量化技術優化內存效率。
大型語言模型
M
Mungert
742
2
Nano Image Captioning
Apache-2.0
這是一個基於bert-tiny和vit-tiny的輕量級圖像字幕生成模型,僅重40MB,在CPU上運行速度極快。
圖像生成文本 Transformers 英語
N
cnmoro
184
3
Tiny Image Captioning
Apache-2.0
一個基於bert-tiny和vit-small的輕量級圖像描述生成模型,僅重100MB,在CPU上運行速度極快。
圖像生成文本 Transformers 英語
T
cnmoro
4,298
2
Mini Image Captioning
Apache-2.0
一個基於bert-mini和vit-small的輕量級圖像字幕生成模型,僅重130MB,在CPU上運行速度極快。
圖像生成文本 Transformers 英語
M
cnmoro
292
3
Llm Data Textbook Quality Fasttext Classifier V1
MIT
基於fasttext構建的文本分類模型,用於判斷文本是否達到教科書級數據質量,可作為大語言模型訓練時的數據篩選工具。
文本分類 英語
L
kenhktsui
35
4
Bge Base En V1.5 Gguf
MIT
該項目提供了以GGUF格式存儲的BGE嵌入模型,適用於與llama.cpp配合使用,提供比transformers更好的性能表現。
文本嵌入
B
CompendiumLabs
1,108
5
Relullama 7B
基於Llama 2 7B微調的ReLU激活稀疏大語言模型,通過動態參數選擇提升計算效率
大型語言模型 Transformers 英語
R
SparseLLM
5,323
11
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase