中文優化

# 中文優化

Baidu ERNIE 4.5 0.3B PT GGUF

基於百度ERNIE-4.5-0.3B-PT模型的量化版本，通過llama.cpp工具進行優化，減少模型大小並提升運行效率。

大型語言模型支持多種語言

Skywork Skywork SWE 32B GGUF

Skywork-SWE-32B是一個32B參數的大語言模型，經過Llamacpp imatrix量化，可在資源受限環境下高效運行。

大型語言模型

Deepseek Ai DeepSeek R1 Distill Qwen 14B GGUF

DeepSeek-R1-Distill-Qwen-14B 是一個經過優化的14B參數規模的大語言模型，由DeepSeek AI發佈，基於Qwen架構蒸餾而來，提供多種GGUF量化版本以提升性能。

大型語言模型

featherless-ai-quants

Deepseek R1 0528 Qwen3 8B AWQ 4bit

DeepSeek-R1-0528-Qwen3-8B的AWQ量化版本，適用於特定場景下的高效推理。

大型語言模型

Tngtech.deepseek R1T Chimera GGUF

DeepSeek-R1T-Chimera 是一個文本生成模型，基於 tngtech 的技術開發，專注於高效的自然語言處理任務。

大型語言模型

Qwen3 30B A3B Gptq 8bit

Qwen3 30B A3B是一個採用GPTQ方法進行8位量化處理的大語言模型，適用於高效推理場景。

大型語言模型

Smoothie Qwen3 4B

順滑Qwen是一款輕量級的調整工具，能夠平滑Qwen及類似模型中的詞元概率，增強多語言的平衡生成能力。

大型語言模型

Transformers 英語

Qwen3-4B是基於Qwen3-4B-Base的GGUF格式模型，適用於文本生成任務。

大型語言模型

React Native Executorch Qwen 3

Qwen 3 是一個基於 ExecuTorch 運行時的語言模型，提供不同規模的量化與未量化版本。

大型語言模型

software-mansion

Qwen3 1.7B ONNX

Qwen3-1.7B 是阿里雲推出的1.7B參數規模的開源大語言模型，基於Transformer架構，支持多種自然語言處理任務。

大型語言模型

Qwq DeepSeek R1 SkyT1 Flash Lightest 32B

這是一個基於Qwen2.5-32B的合併模型，融合了DeepSeek-R1-Distill-Qwen-32B、QwQ-32B和Sky-T1-32B-Flash的特點，旨在提升性能。

大型語言模型

PEG是一種通過漸進式學習實現穩健文本檢索的模型，基於負樣本的難度級別調整損失權重。

Transformers 中文

3b Zh Ft Research Release Q8 0 GGUF

本模型是基於canopylabs/3b-zh-ft-research_release轉換而來的GGUF格式模型，適用於中文文本生成任務。

大型語言模型中文

GLM 4 32B 0414 EXL3

GLM-4-32B-0414是THUDM團隊開發的大規模語言模型，基於GLM架構，適用於多種文本生成任務。

大型語言模型

THUDM.GLM 4 32B 0414 GGUF

GLM-4-32B-0414是由THUDM開發的大規模語言模型，具有320億參數，適用於多種文本生成任務。

大型語言模型

Instancecap Captioner

基於Qwen2.5-VL-7B-Instruct在instancevid數據集上微調的視覺語言模型，專注於實例級圖像描述生成

圖像生成文本

Deepseek V3 5layer

DeepSeek-V3的5層簡化開發版本，適用於輕量級任務和快速實驗。

大型語言模型

Qwen2.5 14B YOYO V2

Qwen2.5-14B-YOYO-V5是基於Qwen2.5-14B基礎模型，通過融合多個預訓練語言模型而成的增強版本。

大型語言模型

YOYO-O1-32B是一個融合了開源社區頂尖32B推理模型與代碼模型的多功能大語言模型，採用SCE融合技術構建。

大型語言模型

Gemma 3 27b Pt Q4 K M GGUF

該模型是基於Google的gemma-3-27b-pt模型通過llama.cpp轉換為GGUF格式的版本，適用於本地推理任務。

大型語言模型

Qwen2.5 VL 7B Instruct GPTQ Int4

Qwen2.5-VL-7B-Instruct-GPTQ-Int4是基於Qwen2.5-VL-7B-Instruct模型進行非官方GPTQ-Int4量化的版本，支持圖文到文本的多模態任務。

圖像生成文本

Transformers 支持多種語言

Qwen2 VL 7B Captioner Relaxed Q4 K M GGUF

這是一個基於Qwen2-VL-7B-Captioner-Relaxed模型轉換的GGUF格式模型，專門用於圖像轉文本任務。

圖像生成文本英語

Deepseek Ai.deepseek R1 Distill Llama 8B GGUF

DeepSeek-R1-Distill-Llama-8B 是一個基於 Llama 架構的 8B 參數規模的大型語言模型，經過蒸餾訓練優化，適用於文本生成任務。

大型語言模型

Llama 3.3 70B Instruct Abliterated Finetuned GPTQ Int8

這是基於Llama-3.3-70B-Instruct模型的GPTQ量化8位版本，經過微調優化，適用於對話推理任務。

大型語言模型

Transformers 支持多種語言

Qwen2 VL 7B Instruct GGUF

Qwen2-VL-7B-Instruct 是一個多模態視覺語言模型，支持圖像和文本的聯合理解與生成。

文本生成圖像

Transformers 英語

Qwen2 VL 7B GGUF

Qwen2-VL-7B 是一個視覺語言模型，提供多種量化版本的 GGUF 格式模型文件，適用於 llama.cpp 使用。

文本生成圖像

Transformers 英語

Qwen2 VL 2B Instruct GGUF

Qwen2-VL-2B-Instruct 是一個視覺語言模型，提供 GGUF 格式的量化版本，適用於 llama.cpp 環境。

文本生成圖像

Transformers 英語

Moxin 7B是一款強大的開源大語言模型，提供基礎模型和聊天模型等多種類型，在多個常見數據集上展現出了良好的性能。

大型語言模型

Llama 3.2 Taiwan 1B

Llama-3.2-Taiwan-1B 是一個基於 Meta 的 Llama-3.2-1B 模型的多語言文本生成模型，特別支持中文（臺灣地區）及其他多種語言。

大型語言模型

Transformers 支持多種語言

GLM-Edge-V-5B是一個50億參數的多模態模型，支持圖像和文本輸入，能夠執行圖像理解和文本生成任務。

圖像生成文本

Glm Edge 1.5b Chat

GLM-Edge-1.5B-Chat 是一個基於 GLM 架構的 15 億參數規模的聊天模型，適用於中文對話場景。

大型語言模型

Summllama3.2 3B GGUF

SummLlama3.2-3B是基於Llama3架構優化的3.2B參數摘要生成模型，提供多種量化版本以適應不同硬件需求。

大型語言模型

Skywork Critic Llama 3.1 8B

天工評判系列模型是先進的評判模型，擅長進行成對偏好評估，能夠對輸入的一對內容進行比較和評估，給出細緻的判斷。

大型語言模型

Minicpm Embedding

MiniCPM-Embedding 是基於 MiniCPM-2B-sft-bf16 基礎模型開發的嵌入模型，專注於檢索任務，支持中英文雙語。

Transformers 支持多種語言

LinFusion是一個基於Diffusers庫的文本生成圖像模型，支持通過文本描述生成高質量圖像。

Sl Persian Ser With Gwo And Hubert

這是一個基於Apache-2.0許可證的開源模型，具體信息需要補充

大型語言模型

通義千問Qwen2系列的大語言模型，包含多個參數規模的模型，從5億到720億參數，支持指令調優。

大型語言模型

這是一個基於Apache-2.0許可證發佈的模型，具體信息暫不可知。

大型語言模型

Qwen2 7B Int4 Inc

基於Qwen2-7B的INT4自動量化模型，由英特爾auto-round工具生成，適用於高效推理任務

大型語言模型

Yi-1.5是Yi模型的升級版本，在編程、數學、推理和指令遵循能力方面表現更出色，同時保持了優秀的語言理解、常識推理和閱讀理解能力。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase