Model Selection

大模型量化

# 大模型量化

Skywork Skywork SWE 32B GGUF

Skywork-SWE-32B是一個32B參數的大語言模型，經過Llamacpp imatrix量化，可在資源受限環境下高效運行。

大型語言模型

Qwen.qwen3 Reranker 4B GGUF

Qwen3-Reranker-4B的量化版本，旨在降低資源消耗同時保持性能

大型語言模型

Google.gemma 3 12b Pt GGUF

這是一個基於google/gemma-3-12b-pt的量化版本模型，旨在通過量化技術讓大型模型更易於使用。

大型語言模型

Google.gemma 3 27b It GGUF

基於谷歌Gemma-3-27b-it模型的量化版本，專注於圖像文本轉文本任務，致力於知識普及化

大型語言模型

Gemma 3 27b It GGUF

Gemma-3-27b-it是Google發佈的27B參數規模的量化版本大語言模型，專注於圖像文本轉換任務。

大型語言模型

Huihui Ai.deepseek R1 Distill Qwen 32B Abliterated GGUF

這是一個量化版本的大語言模型，旨在讓知識更易於獲取和使用。

大型語言模型

Llama 3.1 Nemotron 70B Instruct AWQ INT4

NVIDIA定製的70B參數大語言模型，通過AWQ Int4量化優化，在多個自動對齊基準測試中表現優異

大型語言模型

Transformers Supports Multiple Languages

Wizardcoder Python 13B V1.0 GPTQ

WizardCoder Python 13B V1.0是由WizardLM開發的大語言模型，專注於Python代碼生成任務，基於llama2架構，在HumanEval基準測試中表現優異。

大型語言模型

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers English

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase