低內存優化

# 低內存優化

Pinkpixel Crystal Think V2 GGUF

這是一個對PinkPixel的Crystal-Think-V2模型進行的量化處理版本，提供多種量化類型以滿足不同硬件和性能需求。

大型語言模型英語

Gryphe Codex 24B Small 3.2 GGUF

這是Gryphe的Codex-24B-Small-3.2模型的量化版本，通過量化技術優化了在不同硬件條件下的運行效率。

大型語言模型英語

Mistralai Mistral Small 3.2 24B Instruct 2506 GGUF

這是Mistral-Small-3.2-24B-Instruct-2506模型的Llamacpp imatrix量化版本，提供多種量化類型以滿足不同硬件需求。

大型語言模型支持多種語言

Menlo Jan Nano GGUF

基於llama.cpp對Menlo/Jan - nano模型進行量化處理，提供多種量化類型的模型文件，以滿足不同硬件和性能需求。

大型語言模型

Cognitivecomputations Qwen3 72B Embiggened GGUF

基於cognitivecomputations/Qwen3-72B-Embiggened模型的量化版本，使用llama.cpp進行量化處理，可在多種環境下高效運行。

大型語言模型

BAAI RoboBrain2.0 7B GGUF

這是BAAI的RoboBrain2.0-7B模型的量化版本，通過llama.cpp進行量化處理，提供多種量化類型以適應不同硬件需求。

大型語言模型

Akhil Theerthala Kuvera 8B V0.1.0 GGUF

Kuvera-8B是一個專注於金融和個人理財領域的8B參數大語言模型，提供多種量化版本以適應不同硬件需求。

大型語言模型英語

Xlangai Jedi 7B 1080p GGUF

這是一個使用llama.cpp進行量化的Jedi - 7B - 1080p模型，提供了多種量化類型供用戶選擇，以平衡文件大小和模型質量。

大型語言模型英語

E N V Y Legion V2.1 LLaMa 70B Elarablated V0.8 Hf GGUF

Legion-V2.1-LLaMa-70B-Elarablated-v0.8-hf是基於LLaMa-70B的量化版本，採用llama.cpp進行優化，提供多種量化選項以適應不同硬件需求。

大型語言模型

Nvidia Llama 3.1 Nemotron Nano 4B V1.1 GGUF

基於NVIDIA Llama-3.1-Nemotron-Nano-4B-v1.1模型的量化版本，使用llama.cpp工具進行多種量化處理，適合在資源受限的環境中運行。

大型語言模型英語

Qwen2.5 Omni 7B GPTQ Int4

Qwen2.5-Omni 是一個端到端的多模態模型，能夠感知文本、圖像、音頻和視頻等多種模態，並以流式方式生成文本和自然語音響應。

多模態融合

Transformers 英語

Gemma 3 12B FornaxV.2 QAT CoT Q4 0 GGUF

這是一個實驗性的小型思維模型，旨在8GiB消費級顯卡上運行，具備通用推理能力。通過監督微調（SFT）和高質量推理軌跡訓練，模型能夠將推理能力泛化至多種任務。

大型語言模型

Huihui Ai Qwen3 14B Abliterated GGUF

Qwen3-14B-abliterated是基於Qwen3-14B模型的量化版本，使用llama.cpp進行優化，提供多種量化選項以適應不同性能需求。

大型語言模型

Qwen Qwen3 32B GGUF

基於Qwen/Qwen3-32B的量化版本，使用llama.cpp進行量化，支持多種量化類型，適用於不同硬件需求。

大型語言模型

Qwen Qwen3 1.7B GGUF

基於Qwen/Qwen3-1.7B的量化版本，使用llama.cpp進行量化，支持多種量化類型，適用於文本生成任務。

大型語言模型

Qwen Qwen3 4B GGUF

Qwen團隊提供的Qwen3-4B的Llamacpp imatrix量化版本，支持多種量化類型，適用於文本生成任務。

大型語言模型

Qwen Qwen3 30B A3B GGUF

基於Qwen/Qwen3-30B-A3B的量化版本，使用llama.cpp進行多種精度量化，適用於文本生成任務。

大型語言模型

Llama 3.2 1B Instruct GGUF

Llama-3.2-1B-Instruct 是一個基於 Llama 架構的 1B 參數量的指令微調模型，提供多種量化格式以適應不同硬件需求。

大型語言模型支持多種語言

Tesslate Tessa Rust T1 7B GGUF

Tessa-Rust-T1-7B的量化版本，使用llama.cpp工具進行量化處理，支持在不同硬件條件下高效運行。

大型語言模型

Transformers 英語

Vicoder Html 32B Preview GGUF

ViCoder-HTML-32B-preview是一款強大的AI模型，專為生成完整網站而設計，包括HTML、Tailwind CSS和JavaScript代碼。

大型語言模型其他

Abomimegadarkgasinalgottenevereamession

這是一個基於DARE TIES方法合併的12B參數語言模型，融合了多個預訓練模型，旨在提供強大的文本生成能力。

大型語言模型

Qwen2.5 72B Instruct GGUF

Qwen2.5-72B-Instruct的GGUF量化版本，支持多種精度格式，適用於不同硬件環境的高效推理。

大型語言模型英語

Llama 2 7b Chat Hf GGUF

Llama 2是由Meta開發的7B參數規模的大語言模型，提供多種量化版本以適應不同硬件需求。

大型語言模型英語

Mxbai Rerank Large V2 GGUF

mxbai-rerank-large-v2是一個多語言文本重排序模型，支持多種語言和多種量化格式，適用於不同硬件環境。

文本嵌入支持多種語言

phi-4是微軟研究院開發的開源語言模型，專注於高質量數據和推理能力，適用於內存/計算受限環境。

大型語言模型支持多種語言

Meta Llama 3 8B GGUF

Meta-Llama-3-8B 是一個基於 GGUF 格式的 8B 參數大語言模型，支持多種量化版本，適用於不同硬件環境。

大型語言模型英語

RWKV7 Goose World3 2.9B HF GGUF

基於flash-linear attention格式的RWKV-7模型，支持多語言文本生成任務。

大型語言模型支持多種語言

Rwkv7 2.9B World GGUF

RWKV-7架構的29億參數大語言模型，支持多語言文本生成任務

大型語言模型支持多種語言

這是一個基於Wan-AI/Wan2.1-T2V-1.3B的gguf量化版本，專為文本生成視頻任務設計，兼容comfyui-gguf和gguf節點。

文本生成視頻英語

Thedrummer Cydonia 24B V2.1 GGUF

Cydonia-24B-v2.1是一個24B參數的大語言模型，經過llama.cpp的imatrix量化處理，提供多種量化版本以適應不同硬件需求。

大型語言模型

Rombo Org Rombo LLM V3.1 QWQ 32b GGUF

Rombo-LLM-V3.1-QWQ-32b是一個32B參數規模的大型語言模型，經過llama.cpp的imatrix量化處理，提供多種量化版本以適應不同硬件需求。

大型語言模型

mochi的gguf量化版本是一個文本生成視頻的模型，包含gguf編碼器和gguf變分自編碼器，適用於快速生成視頻內容。

文本生成視頻英語

Thedrummer Cydonia 24B V2 GGUF

這是一個24B參數的大語言模型，經過llama.cpp的imatrix量化處理，提供多種量化版本以適應不同硬件需求。

大型語言模型

Zed Industries Zeta GGUF

這是對zed-industries的zeta模型進行的Llamacpp imatrix量化版本，解決了在不同硬件條件下高效運行模型的問題，提供了多種量化類型供用戶選擇。

大型語言模型

Nera Noctis 12B GGUF

Nera_Noctis-12B的Llamacpp imatrix量化版本，基於Nitral-AI/Nera_Noctis-12B模型，支持英文文本生成任務。

大型語言模型英語

Aura-4B是一個基於AuraIndustries/Aura-4B的量化版本，使用llama.cpp進行imatrix量化，支持多種量化類型，適用於文本生成任務。

大型語言模型英語

mochi是一個基於gguf量化版本的文本生成視頻模型，支持通過文本描述生成視頻內容。

文本生成視頻英語

Starcoder2 3b GGUF

StarCoder2-3B是一個擁有30億參數的代碼生成模型，基於17種編程語言數據訓練，能夠生成代碼片段但可能不完全準確。

大型語言模型

Mixtral 8x7B V0.1

Mixtral-8x7B是一個預訓練的生成式稀疏混合專家模型，在多數基準測試中表現優於Llama 2 70B。

大型語言模型

Transformers 支持多種語言

StarCoder2-3B是一個擁有30億參數的代碼生成模型，基於17種編程語言訓練而成，支持16,384標記的上下文窗口。

大型語言模型

Transformers 其他

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase