4bit量化推理

# 4bit量化推理

GLM 4 32B 0414 4bit DWQ

這是THUDM/GLM-4-32B-0414模型的MLX格式版本，經過4位DWQ量化處理，適用於蘋果芯片設備的高效推理。

大型語言模型支持多種語言

Gemma 3 12b It 4bit DWQ

Gemma 3 12B模型的4位量化版本，適用於MLX框架，支持高效文本生成任務。

大型語言模型

SWE Agent LM 32B 4bit

這是一個基於SWE-bench/SWE-agent-LM-32B模型轉換而來的4位量化版本，專為軟件工程任務優化的語言模型。

大型語言模型

Transformers 英語

Josiefied Qwen3 4B Abliterated V1 4bit

這是一個基於Qwen3-4B模型轉換到MLX格式的4位量化版本，適用於文本生成任務。

大型語言模型

Qwen3 0.6B 4bit

這是一個基於Qwen/Qwen3-0.6B模型轉換的4位量化版本，適用於MLX框架的高效推理。

大型語言模型

GLM 4 32B 0414 4bit

GLM-4-32B-0414-4bit 是基於 THUDM/GLM-4-32B-0414 轉換而來的 MLX 格式模型，支持中英文文本生成任務。

大型語言模型支持多種語言

Philosophy Model

這是一個使用Unsloth和Huggingface TRL庫優化的Mistral-7B指令微調模型，訓練速度提升2倍

大型語言模型

Transformers 英語

Gemma 3 4b It Qat 4bit

Gemma 3 4B IT QAT 4bit 是一個經過量化感知訓練（QAT）的4位量化大語言模型，基於Gemma 3架構，專為MLX框架優化。

圖像生成文本

Transformers 其他

Deepseek R1 Chinese Law

基於Unsloth和Huggingface TRL庫訓練的Llama模型，推理速度提升2倍

大型語言模型

Transformers 英語

Llama 3.2 Vision Instruct Bpmncoder

基於Unsloth優化的Llama 3.2 11B視覺指令微調模型，採用4位量化技術，訓練速度提升2倍

文本生成圖像

Transformers 英語

Qwen2 Vl Instuct Bpmncoder

基於Qwen2-VL-7B模型的4位量化版本，使用Unsloth和Huggingface TRL庫進行訓練，推理速度提升2倍

文本生成圖像

Transformers 英語

基於Unsloth和Huggingface TRL庫優化的Qwen2模型，推理速度提升2倍

大型語言模型

Transformers 英語

Llama 3.2 11B Vision Invoices Mini

基於unsloth/llama-3.2-11b-vision-instruct-unsloth-bnb-4bit微調的多模態大語言模型，支持視覺指令理解任務，使用Unsloth優化訓練速度提升2倍。

文本生成圖像

Transformers 英語

Qwen 2 VL 7B OCR

基於Qwen2-VL-7B模型的微調版本，使用Unsloth和Huggingface的TRL庫進行訓練，速度提升2倍。

文本生成圖像

Transformers 英語

Llama Bodo Translation Model

基於Meta-Llama-3.1-8B的4位量化版本微調的博多語-英語雙向翻譯模型，使用Unsloth優化訓練速度

大型語言模型

Transformers 支持多種語言

Qvikhr 2.5 1.5B Instruct SMPO MLX 4bit

這是一個基於QVikhr-2.5-1.5B-Instruct-SMPO模型的4位量化版本，專為MLX框架優化，支持俄語和英語的指令理解與生成任務。

大型語言模型

Transformers 支持多種語言

Mlx Stable Diffusion 3.5 Large 4bit Quantized

這是基於Stable Diffusion 3.5 Large模型在DiffusionKit MLX框架上量化的版本，適用於圖像生成任務。

文本生成圖像英語

Awportrait FL NF4

AWPortrait-FL的BNB-NF4量化版本，基於FLUX.1-dev開發的文本到圖像生成模型

圖像生成英語

Text2cypher Gemma 2 9b It Finetuned 2024v1

該模型是基於google/gemma-2-9b-it微調的Text2Cypher模型，能夠將自然語言問題轉換為Neo4j圖數據庫的Cypher查詢語句。

知識圖譜英語

Midnight Miqu 70B V1.5 4bit

Midnight-Miqu-70B-v1.5 是一個70B參數規模的大語言模型，支持文本生成等任務。

大型語言模型

Google Gemma 2b AWQ 4bit Smashed

基於google/gemma-2b模型通過AWQ技術壓縮的4位量化版本，旨在提升推理效率並降低資源消耗。

大型語言模型

C4ai Command R V01 4bit

該模型是從 CohereForAI/c4ai-command-r-v01 轉換為 MLX 格式的 4bit 量化版本，支持多語言對話和工具使用。

大型語言模型

Transformers 支持多種語言

Gpt4 X Alpaca 13b Native 4bit 128g

基於GPT4和Alpaca指令微調的13B參數語言模型，支持4bit量化推理

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase