輕量部署

# 輕量部署

Midm 2.0 Base Instruct Gguf

Mi:dm 2.0 是採用 KT 專有技術開發的'以韓國為中心的 AI'模型，深度內化了韓國社會獨特的價值觀、認知框架和常識推理。

大型語言模型

Transformers 支持多種語言

Tencent.hunyuan A13B Instruct GGUF

騰訊混元A13B指令模型的量化版本，通過技術手段在保證性能的同時提升運行效率。

大型語言模型

Fpham Sydney Overthinker 13b HF GGUF

該項目提供了優化後的GGUF量化文件，可顯著提升模型性能。這些量化文件由Featherless AI提供支持，用戶只需支付少量費用，即可運行任意所需模型。

大型語言模型

featherless-ai-quants

Josiefied DeepSeek R1 0528 Qwen3 8B Abliterated V1 8bit

這是一個基於DeepSeek-R1-0528-Qwen3-8B模型轉換的MLX格式8位量化版本，適用於文本生成任務。

大型語言模型

Deepseek R1 0528 Qwen3 8B 4bit

該模型是基於DeepSeek-R1-0528-Qwen3-8B轉換的4位量化版本，專為MLX框架優化，適用於文本生成任務。

大型語言模型

Devstral Small 2505 GGUF

Devstral-Small-2505的量化版本，提供多種精度選擇以適應不同硬件需求

大型語言模型支持多種語言

Sam Reason S2.1 GGUF

Sam-reason-S2.1的靜態量化版本，提供多種量化選項以適應不同硬件需求

大型語言模型英語

INTELLECT 2 GGUF

INTELLECT-2-GGUF 是 PrimeIntellect/INTELLECT-2 的 GGUF 格式量化版本，適用於文本生成任務。

大型語言模型

Qwen3 4B 4bit DWQ

該模型是Qwen3-4B的4位DWQ量化版本，轉換為MLX格式，方便使用mlx庫進行文本生成。

大型語言模型

Huihui Ai.qwen3 4B Abliterated GGUF

慧慧AI的Qwen3-4B模型的量化版本，旨在讓知識更廣泛地被大眾獲取。

大型語言模型

Josiefied Qwen3 4B Abliterated V1 6bit

這是一個基於Qwen3-4B模型轉換至MLX格式的6位量化版本，適用於文本生成任務。

大型語言模型

Qwen3 8B 4bit DWQ

Qwen3-8B-4bit-DWQ 是基於 Qwen/Qwen3-8B 轉換至 MLX 格式的 4 位量化版本，適用於在 Apple 設備上高效運行。

大型語言模型

Mlabonne Qwen3 4B Abliterated GGUF

Qwen3-4B-abliterated的量化版本，使用llama.cpp進行量化，支持多種量化類型，適用於文本生成任務。

大型語言模型

Josiefied Qwen3 1.7B Abliterated V1 4bit

基於Qwen3-1.7B的4位量化版本，適用於MLX框架的輕量級大語言模型

大型語言模型

這是Qwen/Qwen3-8B模型的4位量化版本，已轉換為MLX框架格式，適用於蘋果芯片設備的高效推理。

大型語言模型

Qwen3-4B-4bit 是從 Qwen/Qwen3-4B 轉換至 MLX 格式的 4 位量化版本，適用於在 Apple 芯片上高效運行。

大型語言模型

Internvl2 5 1B MNN

基於InternVL2_5-1B的4位量化版本，適用於文本生成和聊天場景

大型語言模型英語

Jungzoona T3Q Qwen2.5 14b V1.0 E3 GGUF

本倉庫包含JungZoona/T3Q-qwen2.5-14b-v1.0-e3的GGUF格式模型文件，由TensorBlock提供的機器進行量化，兼容llama.cpp。

大型語言模型

Transformers 支持多種語言

Deepcogito Cogito V1 Preview Llama 3B GGUF

基於Llama架構的3B參數語言模型，提供多種量化版本以適應不同硬件需求

大型語言模型

Llama381binstruct Summarize Short Merged

基於Meta-Llama-3.1-8B-Instruct的合併模型，針對法律領域摘要任務進行了微調，能將法律術語轉換為簡短易懂的摘要。

大型語言模型

GLM-4-Z1-9B-0414是GLM家族的新一代開源模型，具備優秀的數學推理與通用能力，適合資源受限場景下的輕量部署。

大型語言模型

Transformers 支持多種語言

Xlm Roberta Base Language Detection Tfjs

這是一個基於XLM-RoBERTa的多語言檢測模型，支持20種語言的識別。

文本分類支持多種語言

Lightblue Reranker 0.5 Cont Filt 7max Gguf

這是一個文本排序模型，用於對文本進行相關性排序。

TraceBack 12b 是基於 Mistral-Nemo-Instruct 架構的 4bit 量化版本，專注於指令遵循和思維鏈推理任務。

大型語言模型

Chroma-GGUF 是一個基於 lodestones/Chroma 的量化模型集合，提供多種不同精度的量化版本，適用於不同的硬件和性能需求。

Ozone Ai 0x Lite GGUF

基於ozone-ai/0x-lite模型的量化版本，支持中英文文本生成任務，採用llama.cpp進行imatrix量化，提供多種量化選項以適應不同硬件需求。

大型語言模型支持多種語言

Janus Pro 1B 4bit

基於deepseek-ai/Janus-Pro-1B的4位量化版本，適用於Apple芯片的MLX框架

大型語言模型

Huihui Ai.deepseek R1 Distill Qwen 32B Abliterated GGUF

這是一個量化版本的大語言模型，旨在讓知識更易於獲取和使用。

大型語言模型

基於Qwen2.5-1.5B-Instruct微調的俄語指令優化模型，15億參數，支持俄英雙語，擅長RAG流程中的文本問答

大型語言模型

Transformers 支持多種語言

Llama 3.2 3B Instruct GGUF

Llama-3.2-3B-Instruct 模型的 GGUF 格式文件，方便用戶進行文本生成任務。

大型語言模型

FLUX.1 Schnell GGUF

FLUX.1-schnell 是一個高效的文本生成圖像模型，基於擴散模型架構，支持英文文本輸入生成高質量圖像。

文本生成圖像英語

FLUX.1 Schnell GGUF

FLUX.1-schnell的.gguf量化版本，用於文本到圖像的轉換任務

文本生成圖像

該模型是通過ggml.ai的GGUF-my-repo空間，使用llama.cpp從BAAI/bge-m3轉換為GGUF格式的句子相似度模型。

Moralbert Predict Subversion In Lyrics

這是一個基於PyTorch的文本分類模型，適用於多種文本分類任務。

Mistral Nemo Instruct 2407 GGUF

Mistral-Nemo-Instruct-2407-GGUF 是 mistralai/Mistral-Nemo-Instruct-2407 的 GGUF 格式量化版本，支持多種量化位數（2-bit 至 8-bit），適用於文本生成任務。

大型語言模型

Omost Dolphin 2.9 Llama3 8b 4bits

Omost發佈的基於Llama3-8B的指令微調模型，採用Dolphin-2.9數據集預訓練，並以4位NF4格式量化。

大型語言模型

Omost Llama 3 8b 4bits

Omost 發佈的 llama-3 模型，具有 8k 上下文長度，採用 nf4 量化。

大型語言模型

Openchat 3.6 8b 20240522 IMat GGUF

這是對 openchat/openchat-3.6-8b-20240522 模型進行 Llama.cpp imatrix 量化處理後的版本，提供了不同量化類型的文件，方便用戶根據需求下載和使用。

大型語言模型

Deepseek V2 Lite IMat GGUF

DeepSeek-V2-Lite 的 GGUF 量化版本，通過 Llama.cpp imatrix 量化處理，減少存儲和計算資源需求，便於部署。

大型語言模型

Llama3 Toxic 8B Float16

基於unsloth/llama-3-8b-bnb-4bit微調的文本生成模型，使用Unsloth和TRL庫訓練，速度提升2倍

大型語言模型

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase