# 72B大模型
Kimi Dev 72B 8bit
MIT
Kimi-Dev-72B-8bit 是基于 moonshotai/Kimi-Dev-72B 转换的 8 位量化版本,适用于 MLX 框架的文本生成模型。
大型语言模型 Other
K
mlx-community
397
2
Kimi Dev 72B 4bit DWQ
MIT
Kimi-Dev-72B-4bit-DWQ 是一个基于 moonshotai/Kimi-Dev-72B 转换而来的 4 位量化大语言模型,适用于 MLX 框架。
大型语言模型 Other
K
mlx-community
769
15
Kimi Dev 72B 4bit
MIT
Kimi-Dev-72B-4bit 是一个基于 moonshotai/Kimi-Dev-72B 转换的 4 位量化大语言模型,专为 MLX 框架优化。
大型语言模型 Other
K
mlx-community
298
1
Kimi Dev 72B 5bit
MIT
Kimi-Dev-72B-5bit 是一个基于 moonshotai/Kimi-Dev-72B 转换的 5 位量化大语言模型,适用于 Apple 设备的 MLX 框架。
大型语言模型 Other
K
mlx-community
210
3
Moonshotai Kimi Dev 72B GGUF
Kimi-Dev-72B是由moonshotai开发的大规模语言模型,经过GGUF量化优化,提供多种量化版本以适应不同硬件需求。
大型语言模型
M
featherless-ai-quants
290
1
Cognitivecomputations Qwen3 72B Embiggened GGUF
Apache-2.0
基于cognitivecomputations/Qwen3-72B-Embiggened模型的量化版本,使用llama.cpp进行量化处理,可在多种环境下高效运行。
大型语言模型
C
bartowski
826
1
VL Rethinker 72B 4bit
Apache-2.0
VL-Rethinker-72B-4bit是一个基于Qwen2.5-VL-7B-Instruct的多模态模型,支持视觉问答任务,已转换为MLX格式以便在苹果设备上高效运行。
文本生成图像
Transformers English

V
mlx-community
26
0
72B Qwen2.5 Kunou V1 GGUF
Other
基于Qwen2.5-72B-Instruct的量化版本,采用llama.cpp进行多种量化处理,适用于本地推理
大型语言模型
7
bartowski
319
4
Rombos LLM V2.5 Qwen 72b
Other
Rombos-LLM-V2.5-Qwen-72b是Qwen2.5-72B的持续微调版本,通过特定方法融合指令模型和基础模型,展现出更优的性能。
大型语言模型
Transformers

R
rombodawg
1,160
38
Magnum V1 72b
Other
基于Qwen-2 72B Instruct微调的模型,旨在复现Claude 3模型的散文质量
大型语言模型
Transformers Supports Multiple Languages

M
anthracite-org
60
166
ECE TW3 JRGL V5
Apache-2.0
ECE-TW3-JRGL-V5 是一个通过 mergekit 合并 MoMo-72B-lora-1.8.7-DPO 和 alpaca-dragon-72b-v1 模型得到的新模型,融合了多个模型的优势。
大型语言模型
Transformers

E
paloalma
10.59k
1
Rhea 72b V0.5
Apache-2.0
Rhea-72b-v0.5是基于Smaug-72B-v0.1微调的大语言模型,在HuggingFace开放大模型排行榜上排名第一。
大型语言模型
Transformers English

R
davidkim205
103
135
Ao Karasu 72B
Ao Karasu 72B 是一个72B参数规模的大型语言模型,主要用于日语和英语的文本生成任务。
大型语言模型
Transformers

A
lightblue
19
14
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98