本地推理

# 本地推理

INTELLECT 2 GGUF

INTELLECT-2-GGUF 是 PrimeIntellect/INTELLECT-2 的 GGUF 格式量化版本，適用於文本生成任務。

大型語言模型

Qwen3 8B 4bit DWQ

Qwen3-8B-4bit-DWQ 是基於 Qwen/Qwen3-8B 轉換至 MLX 格式的 4 位量化版本，適用於在 Apple 設備上高效運行。

大型語言模型

Qwen3 30B A3B MLX 4bit

Qwen3-30B-A3B-MLX-8bit 是基於 Qwen/Qwen3-30B-A3B 轉換的 8 位量化版本，專為 MLX 框架優化，適用於文本生成任務。

大型語言模型

lmstudio-community

Gemma 3 12b It GGUF

Gemma 3 12B 的 GGUF 量化版本，適用於文本生成任務。

大型語言模型

Pllum 8x7B Chat GGUF

PLLuM-8x7B-chat的GGUF量化版本，針對本地推理優化，支持多種量化級別以適應不同硬件需求。

大型語言模型

piotrmaciejbednarski

Llama 3.2 3B Instruct Abliterated GGUF

Llama-3.2-3B-Instruct-abliterated的GGUF格式量化版本，支持多種比特量化選項，適用於文本生成任務。

大型語言模型

Llama 3.2 3B Instruct GGUF

Llama-3.2-3B-Instruct 模型的 GGUF 格式文件，方便用戶進行文本生成任務。

大型語言模型

Phi 3.5 Mini Instruct GGUF

Phi-3.5-mini-instruct的GGUF格式模型文件，適用於文本生成任務。

大型語言模型

Mistral Nemo Instruct 2407 GGUF

Mistral-Nemo-Instruct-2407-GGUF 是 mistralai/Mistral-Nemo-Instruct-2407 的 GGUF 格式量化版本，支持多種量化位數（2-bit 至 8-bit），適用於文本生成任務。

大型語言模型

Deepseek V2 Lite IMat GGUF

DeepSeek-V2-Lite 的 GGUF 量化版本，通過 Llama.cpp imatrix 量化處理，減少存儲和計算資源需求，便於部署。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase