大模型輕量化

# 大模型輕量化

Thedrummer Cydonia 24B V3 GGUF

這是TheDrummer的Cydonia-24B-v3模型的量化版本，使用llama.cpp進行量化處理，提供了多種量化選項以適應不同硬件和使用場景。

大型語言模型

Qwen3 30B A3B Abliterated Fp4

這是Qwen3-30B-A3B-abliterated的4位量化模型，參數規模相當於8B，適合文本生成任務。

大型語言模型

Qwen Qwen3 32B GGUF

基於Qwen/Qwen3-32B的量化版本，使用llama.cpp進行量化，支持多種量化類型，適用於不同硬件需求。

大型語言模型

GLM 4 32B 0414 4bit

GLM-4-32B-0414-4bit 是基於 THUDM/GLM-4-32B-0414 轉換而來的 MLX 格式模型，支持中英文文本生成任務。

大型語言模型支持多種語言

Wan2.1 FLF2V 14B 720P Gguf

Wan2.1-FLF2V-14B-720P 是一個視頻生成模型，支持從圖像生成視頻，適用於多種視頻創作場景。

視頻處理支持多種語言

Belle Whisper Large V3 Turbo Zh Ct2

這是BELLE-2/Belle-whisper-large-v3-turbo-zh模型的CTranslate2格式轉換版本，適用於高效語音識別任務。

Llm2vec Meta Llama 31 8B Instruct Mntp Unsup Simcse

LLM2Vec是一種將僅解碼器架構的大語言模型轉換為文本編碼器的方案，通過啟用雙向注意力、掩碼下一詞預測和無監督對比學習實現轉換。

文本嵌入英語

Molmo 7B D Bnb 4bit

Molmo-7B-D是一個經過BnB 4bit量化的大語言模型，模型體積從30GB減小到7GB，顯存需求降低至約12GB。

大型語言模型

C4ai Command R 08 2024

這是一個基於CoForAI/c4ai-command-r-08-2024模型轉換的GGUF格式文本生成模型，支持多種語言。

大型語言模型支持多種語言

Malaysian Distil Whisper Large V3

基於馬來西亞數據集蒸餾優化的Whisper Large V3語音識別模型，支持馬來語等多種語言

Transformers 支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase