本地部署

# 本地部署

Jan-nano-8bit 是基于 Menlo/Jan-nano 模型转换而来的 8 位量化版本，专为 MLX 框架优化，适用于文本生成任务。

大型语言模型

Minicpm4 8B Q8 0 GGUF

MiniCPM4-8B-Q8_0-GGUF 是通过 llama.cpp 将 openbmb/MiniCPM4-8B 转换为 GGUF 格式的模型，适用于本地推理。

大型语言模型

Transformers 支持多种语言

Chinda Qwen3 4b Gguf

Chinda LLM 4B是iApp Technology推出的前沿泰语模型，基于Qwen3-4B架构构建，为泰国AI生态系统带来先进的思考能力。

大型语言模型

Qwen3 235B A22B 4bit DWQ

Qwen3-235B-A22B-4bit-DWQ是基于Qwen3-235B-A22B-8bit模型转换而来的4位量化版本，适用于文本生成任务。

大型语言模型

Qwen3 8B 4bit AWQ

Qwen3-8B-4bit-AWQ 是基于 Qwen/Qwen3-8B 转换的 4bit AWQ 量化版本，适用于 MLX 框架的文本生成任务。

大型语言模型

Qwen3 30B A3B 4bit

Qwen3-30B-A3B-4bit是基于Qwen/Qwen3-30B-A3B转换的4位量化版本，适用于在MLX框架下进行高效的文本生成任务。

大型语言模型

Qwen3 8B MLX 8bit

基于Qwen/Qwen3-8B转换的8位量化MLX格式大语言模型，适用于文本生成任务

大型语言模型

lmstudio-community

Qwen3 14B MLX 4bit

Qwen3-14B-4bit是基于Qwen/Qwen3-14B模型使用mlx-lm转换的4位量化版本，适用于文本生成任务。

大型语言模型

lmstudio-community

Thedrummer Gemmasutra 9B V1.1 GGUF

这是一个基于TheDrummer/Gemmasutra-9B-v1.1模型的量化版本，使用llama.cpp进行量化处理，适用于文本生成任务。

大型语言模型

Qwen2.5 Coder 0.5B Q8 0 GGUF

这是一个基于Qwen2.5-Coder-0.5B模型转换的GGUF格式模型，适用于代码生成任务。

大型语言模型支持多种语言

Smollm 135M 4bit

这是一个4位量化的135M参数小型语言模型，适用于资源受限环境下的文本生成任务。

大型语言模型

Transformers 英语

Gemma 2 27b It Q8 0 GGUF

这是一个基于Google Gemma 2B模型转换而来的GGUF格式模型，适用于文本生成任务。

大型语言模型

Phi 3 Mini 128k Instruct Function GGUF

Phi-3-mini-128k-instruct_function 是一个基于 GGUF 格式量化的文本生成模型，支持多种量化级别。

大型语言模型

Meta Llama 3 70B Instruct GGUF

Llama 3 70B Instruct的GGUF格式版本，提供更高效的本地运行体验

大型语言模型

Transformers 英语

Longalpaca 13B GGUF

LongAlpaca-13B-GGUF是基于Yukang/LongAlpaca-13B模型的GGUF格式量化版本，支持2-8比特的量化选项，适用于本地文本生成任务。

大型语言模型

Tinyllama 1.1B Chat V1.0 GGUF

TinyLlama是一个1.1B参数的轻量级Llama模型，专为聊天和编程辅助任务优化。

大型语言模型英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase