本地部署

# 本地部署

Jan-nano-8bit 是基於 Menlo/Jan-nano 模型轉換而來的 8 位量化版本，專為 MLX 框架優化，適用於文本生成任務。

大型語言模型

Minicpm4 8B Q8 0 GGUF

MiniCPM4-8B-Q8_0-GGUF 是通過 llama.cpp 將 openbmb/MiniCPM4-8B 轉換為 GGUF 格式的模型，適用於本地推理。

大型語言模型

Transformers 支持多種語言

Chinda Qwen3 4b Gguf

Chinda LLM 4B是iApp Technology推出的前沿泰語模型，基於Qwen3-4B架構構建，為泰國AI生態系統帶來先進的思考能力。

大型語言模型

Qwen3 235B A22B 4bit DWQ

Qwen3-235B-A22B-4bit-DWQ是基於Qwen3-235B-A22B-8bit模型轉換而來的4位量化版本，適用於文本生成任務。

大型語言模型

Qwen3 8B 4bit AWQ

Qwen3-8B-4bit-AWQ 是基於 Qwen/Qwen3-8B 轉換的 4bit AWQ 量化版本，適用於 MLX 框架的文本生成任務。

大型語言模型

Qwen3 30B A3B 4bit

Qwen3-30B-A3B-4bit是基於Qwen/Qwen3-30B-A3B轉換的4位量化版本，適用於在MLX框架下進行高效的文本生成任務。

大型語言模型

Qwen3 8B MLX 8bit

基於Qwen/Qwen3-8B轉換的8位量化MLX格式大語言模型，適用於文本生成任務

大型語言模型

lmstudio-community

Qwen3 14B MLX 4bit

Qwen3-14B-4bit是基於Qwen/Qwen3-14B模型使用mlx-lm轉換的4位量化版本，適用於文本生成任務。

大型語言模型

lmstudio-community

Gemma 3 1b It Abliterated GGUF

基於mlabonne/gemma-3-1b-it-abliterated轉換的GGUF格式模型，適用於本地推理任務

大型語言模型

Gemma 3 27b It Abliterated Mlx 4Bit

這是一個基於mlabonne/gemma-3-27b-it-abliterated模型轉換而來的4位量化版本，專為MLX框架優化。

大型語言模型

Thedrummer Gemmasutra 9B V1.1 GGUF

這是一個基於TheDrummer/Gemmasutra-9B-v1.1模型的量化版本，使用llama.cpp進行量化處理，適用於文本生成任務。

大型語言模型

Qwen2.5 Coder 0.5B Q8 0 GGUF

這是一個基於Qwen2.5-Coder-0.5B模型轉換的GGUF格式模型，適用於代碼生成任務。

大型語言模型支持多種語言

Smollm 135M 4bit

這是一個4位量化的135M參數小型語言模型，適用於資源受限環境下的文本生成任務。

大型語言模型

Transformers 英語

Gemma 2 27b It Q8 0 GGUF

這是一個基於Google Gemma 2B模型轉換而來的GGUF格式模型，適用於文本生成任務。

大型語言模型

Phi 3 Mini 128k Instruct Function GGUF

Phi-3-mini-128k-instruct_function 是一個基於 GGUF 格式量化的文本生成模型，支持多種量化級別。

大型語言模型

Meta Llama 3 70B Instruct GGUF

Llama 3 70B Instruct的GGUF格式版本，提供更高效的本地運行體驗

大型語言模型

Transformers 英語

Longalpaca 13B GGUF

LongAlpaca-13B-GGUF是基於Yukang/LongAlpaca-13B模型的GGUF格式量化版本，支持2-8比特的量化選項，適用於本地文本生成任務。

大型語言模型

Tinyllama 1.1B Chat V1.0 GGUF

TinyLlama是一個1.1B參數的輕量級Llama模型，專為聊天和編程輔助任務優化。

大型語言模型英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase