本地推理

# 本地推理

INTELLECT 2 GGUF

INTELLECT-2-GGUF 是 PrimeIntellect/INTELLECT-2 的 GGUF 格式量化版本，适用于文本生成任务。

大型语言模型

Qwen3 8B 4bit DWQ

Qwen3-8B-4bit-DWQ 是基于 Qwen/Qwen3-8B 转换至 MLX 格式的 4 位量化版本，适用于在 Apple 设备上高效运行。

大型语言模型

Qwen3 30B A3B MLX 4bit

Qwen3-30B-A3B-MLX-8bit 是基于 Qwen/Qwen3-30B-A3B 转换的 8 位量化版本，专为 MLX 框架优化，适用于文本生成任务。

大型语言模型

lmstudio-community

Gemma 3 12b It GGUF

Gemma 3 12B 的 GGUF 量化版本，适用于文本生成任务。

大型语言模型

Pllum 8x7B Chat GGUF

PLLuM-8x7B-chat的GGUF量化版本，针对本地推理优化，支持多种量化级别以适应不同硬件需求。

大型语言模型

piotrmaciejbednarski

Llama 3.2 3B Instruct Abliterated GGUF

Llama-3.2-3B-Instruct-abliterated的GGUF格式量化版本，支持多种比特量化选项，适用于文本生成任务。

大型语言模型

Llama 3.2 3B Instruct GGUF

Llama-3.2-3B-Instruct 模型的 GGUF 格式文件，方便用户进行文本生成任务。

大型语言模型

Phi 3.5 Mini Instruct GGUF

Phi-3.5-mini-instruct的GGUF格式模型文件，适用于文本生成任务。

大型语言模型

Mistral Nemo Instruct 2407 GGUF

Mistral-Nemo-Instruct-2407-GGUF 是 mistralai/Mistral-Nemo-Instruct-2407 的 GGUF 格式量化版本，支持多种量化位数（2-bit 至 8-bit），适用于文本生成任务。

大型语言模型

Deepseek V2 Lite IMat GGUF

DeepSeek-V2-Lite 的 GGUF 量化版本，通过 Llama.cpp imatrix 量化处理，减少存储和计算资源需求，便于部署。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase