Tencent.hunyuan A13B Instruct GGUF
腾讯混元A13B指令模型的量化版本,通过技术手段在保证性能的同时提升运行效率。
大型语言模型
T
DevQuasar
402
1
Gemma 3n E2B It Unsloth Bnb 4bit
Gemma 3n-E2B-it 是 Google 推出的轻量级开源多模态模型,基于与 Gemini 相同技术构建,专为低资源设备优化。
图像生成文本
Transformers 英语

G
unsloth
4,914
2
Gryphe Codex 24B Small 3.2 GGUF
Apache-2.0
这是Gryphe的Codex-24B-Small-3.2模型的量化版本,通过量化技术优化了在不同硬件条件下的运行效率。
大型语言模型 英语
G
bartowski
626
3
Gemma 3n E4B It
Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建,支持文本、音频和视觉输入。
图像生成文本
Transformers

G
google
1,690
81
Fanar 1 9B Instruct
Apache-2.0
Fanar-1-9B-Instruct 是一款强大的阿拉伯语 - 英语大语言模型,由卡塔尔计算研究机构(QCRI)开发,支持现代标准阿拉伯语及多种阿拉伯方言,并与伊斯兰价值观和阿拉伯文化保持一致。
大型语言模型
Transformers 支持多种语言

F
QCRI
115
1
Kakaocorp.kanana 1.5 8b Instruct 2505 GGUF
Kanana-1.5-8B-Instruct-2505 是由 Kakao Corp 开发的一个 8B 参数规模的指令微调语言模型,适用于文本生成任务。
大型语言模型
K
DevQuasar
483
1
Marin Community.marin 8b Instruct GGUF
marin-8b-instruct 是一个 8B 参数规模的指令微调语言模型,适用于文本生成任务。
大型语言模型
M
DevQuasar
343
1
Seed Coder 8B Instruct GGUF
MIT
Seed-Coder-8B-Instruct 是一款强大的开源代码模型,具有以模型为中心、透明和高性能等特点,在多种编码任务中表现出色。
大型语言模型
Transformers

S
unsloth
3,391
1
Qwen2.5 1.5B S1k 1.1
该模型是基于Qwen/Qwen2.5-1.5B-Instruct微调而来的文本生成模型,使用TRL进行训练,为文本生成任务提供了强大的支持。
大型语言模型
Transformers

Q
rvindra
1,312
1
Spatial LLaVA 7B Gguf
Apache-2.0
Spatial-LLaVA-7B是基于LLaVA模型微调的多模态模型,专注于提升空间关系推理能力,适用于多模态研究和聊天机器人开发。
文本生成图像
Safetensors
S
rogerxi
252
1
Gryphe Pantheon Proto RP 1.8 30B A3B GGUF
Apache-2.0
这是一个基于Gryphe/Pantheon-Proto-RP-1.8-30B-A3B模型的量化版本,使用llama.cpp进行量化,适用于角色扮演和文本生成任务。
大型语言模型 英语
G
bartowski
2,972
6
Bielik 4.5B V3.0 Instruct FP8 Dynamic
Apache-2.0
该模型是Bielik-4.5B-v3.0-Instruct的FP8量化版本,通过AutoFP8技术将权重和激活量化为FP8数据类型,减少约50%的磁盘空间和GPU内存需求。
大型语言模型 其他
B
speakleash
74
1
Bielik 1.5B V3.0 Instruct FP8 Dynamic
Apache-2.0
这是一个基于Bielik-1.5B-v3.0-Instruct模型的FP8动态量化版本,适配vLLM或SGLang推理框架,通过AutoFP8量化技术将参数字节数从16位降至8位,显著降低磁盘空间和GPU显存需求。
大型语言模型 其他
B
speakleash
31
1
Bielik 1.5B V3.0 Instruct GGUF
Apache-2.0
这是一个波兰语的1.5B参数指令微调模型,基于SpeakLeash的Bielik系列开发,适用于文本生成任务。
大型语言模型 其他
B
speakleash
341
3
Allenai.olmo 2 0425 1B Instruct GGUF
OLMo-2-0425-1B-Instruct是由AllenAI开发的一个10亿参数规模的指令微调语言模型,专注于文本生成任务。
大型语言模型
A
DevQuasar
220
1
Olmo 2 0425 1B Instruct GGUF
Apache-2.0
OLMo 2 1B指令版是基于OLMo-2-0425-1B-RLVR1模型的后训练变体,经过监督微调、DPO训练和RLVR训练,旨在实现多种任务的最先进性能。
大型语言模型 英语
O
unsloth
3,137
3
Smollm 135M Instruct
Apache-2.0
一个轻量级指令微调语言模型,专为移动端部署优化
大型语言模型
S
litert-community
131
1
Josiefied Qwen3 4B Abliterated V1 Gguf
Apache-2.0
这是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本,适用于本地部署和运行。
大型语言模型
J
Goekdeniz-Guelmez
4,518
7
Olmo 2 0425 1B Instruct
Apache-2.0
OLMo 2 1B是基于allenai/OLMo-2-0425-1B-RLVR1模型的后训练变体,经过监督微调、DPO训练和RLVR训练,旨在实现多种任务的最先进性能。
大型语言模型
Transformers 英语

O
allenai
5,127
33
Industry Project V2
Apache-2.0
基于Mistral架构优化的指令微调模型,适用于零样本分类任务
大型语言模型
I
omsh97
58
0
Stablelm Zephyr 3b GGUF
其他
StableLM Zephyr 3B是一个30亿参数的指令调优模型,基于公开数据集、合成数据集和直接偏好优化(DPO)训练,性能表现优异。
大型语言模型 英语
S
brittlewis12
51
1
Gemma 2 9b It Abliterated GGUF
基于Gemma 2.9B的量化版本,使用llama.cpp进行优化,适合在LM Studio中运行。
大型语言模型 英语
G
bartowski
3,941
37
Aya 23 8B
Aya-23是一个开放权重的指令微调模型研究版本,具有高度先进的多语言能力,支持23种语言。
大型语言模型
Transformers 支持多种语言

A
CohereLabs
10.28k
415
Llama Krikri 8B Instruct
Llama-Krikri-8B-Instruct是由雅典娜研究中心开发的希腊语指令调优大语言模型,基于Llama-3.1-8B构建,增强了希腊语和英语的多任务处理能力。
大型语言模型
Transformers 支持多种语言

L
ilsp
1,630
18
Badger Writer Llama 3 8b
Badger Writer 是基于多个 Llama 3 8B 模型的归一化傅里叶任务叠加模型,专注于文本生成任务,特别擅长创意写作和指令跟随。
大型语言模型
Transformers

B
maldv
106
10
MKLLM 7B Instruct
MKLLM-7B是一款面向马其顿语的开源大语言模型,基于Mistral-7B-v0.1模型通过持续预训练马其顿语和英语混合文本构建而成。
大型语言模型
Transformers 支持多种语言

M
trajkovnikola
31
8
Gemma 2 Llama Swallow 27b It V0.1
基于Gemma-2架构的日语增强大语言模型,通过持续预训练显著提升日语能力,同时保留原版英语能力
大型语言模型
Transformers 支持多种语言

G
tokyotech-llm
27
1
Gemma 2 Llama Swallow 9b It V0.1
Gemma-2-Llama-Swallow系列模型是在Gemma-2基础上进行持续预训练构建的多语言大模型,特别增强了日语能力。
大型语言模型
Transformers 支持多种语言

G
tokyotech-llm
2,491
3
Gemma 2 Llama Swallow 2b It V0.1
Gemma-2-Llama-Swallow系列是通过对gemma-2模型进行持续预训练构建的,显著增强了日文语言处理能力,同时保留原有英文能力。
大型语言模型
Transformers 支持多种语言

G
tokyotech-llm
61
1
Turkish Gemma 9b V0.1
Turkish-Gemma-9b-v0.1是基于Gemma-2-9b开发的土耳其语文本生成模型,通过持续预训练、监督微调(SFT)、直接偏好优化(DPO)和模型合并技术优化而成。
大型语言模型
Safetensors
T
ytu-ce-cosmos
167
18
Bielik 4.5B V3.0 Instruct
Apache-2.0
Bielik-4.5B-v3-Instruct是一款拥有46亿参数的波兰语生成式文本模型,基于Bielik-4.5B-v3进行指令微调,展现出卓越的波兰语理解和处理能力。
大型语言模型
Transformers 其他

B
speakleash
1,121
13
Olmo 2 0425 1B
Apache-2.0
OLMo 2 1B是艾伦人工智能研究所推出的开放语言模型系列中最小的模型,基于OLMo-mix-1124预训练,并在中期训练阶段使用Dolmino-mix-1124数据集。
大型语言模型
Transformers 英语

O
allenai
13.31k
45
Falcon E 1B Instruct
其他
Falcon-E-1B-Instruct 是一个基于1.58比特架构的高效语言模型,专为边缘设备优化,具有低内存占用和高性能的特点。
大型语言模型
Transformers

F
tiiuae
87
7
Qwen2.5 Recursive Coder 14B Instruct
Apache-2.0
基于Qwen2.5架构的14B参数规模代码生成与理解模型,通过Model Stock方法融合多个专业编码模型而成
大型语言模型
Transformers

Q
spacematt
39
2
Videochat R1 Thinking 7B
Apache-2.0
VideoChat-R1-thinking_7B 是一个基于 Qwen2.5-VL-7B-Instruct 的多模态模型,专注于视频文本转文本任务。
视频生成文本
Transformers 英语

V
OpenGVLab
800
0
Multilingual E5 Large Instruct Q8 0 GGUF
MIT
多语言E5大型指令模型,支持多种语言的文本嵌入和分类任务,具有强大的跨语言能力。
大型语言模型 支持多种语言
M
Gomez12
90
1
R01 Gemma 3 1b It
Gemma 3是谷歌推出的轻量级开源多模态模型,基于与Gemini相同技术构建,支持文本和图像输入并生成文本输出。
文本生成图像
Transformers 英语

R
EpistemeAI
17
1
Latxa Llama 3.1 70B Instruct FP8
Latxa是基于Llama-3.1的70B参数巴斯克语大语言模型,经过指令微调和FP8量化,专为巴斯克语优化设计
大型语言模型
Transformers

L
HiTZ
988
1
MT Gen10 Gemma 2 9B
这是一个基于Gemma-2-9B系列模型通过DARE TIES方法合并的多模型融合版本,整合了多个Gemma变体的优势。
大型语言模型
Transformers

M
zelk12
26
2
Qwen2.5 1.5B Instruct
Apache-2.0
专为Gensyn RL Swarm设计的1.5B参数指令微调模型,支持通过点对点强化学习进行本地微调
大型语言模型
Transformers 英语

Q
Gensyn
2.1M
4
- 1
- 2
- 3
- 4
- 5
- 6
- 9
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98