# 多轮对话支持

Qwen3 8B Q4 K M GGUF
Apache-2.0
这是Qwen3-8B模型的GGUF格式版本,适用于llama.cpp框架,支持文本生成任务。
大型语言模型 Transformers
Q
ufoym
342
3
Qwen3 1.7B 4bit
Apache-2.0
Qwen3-1.7B-4bit是通义千问1.7B模型的4位量化版本,已转换为MLX框架格式,便于在Apple Silicon设备上高效运行。
大型语言模型
Q
mlx-community
11.85k
2
Qwen3 0.6B 4bit
Apache-2.0
这是一个基于Qwen/Qwen3-0.6B模型转换的4位量化版本,适用于MLX框架的高效推理。
大型语言模型
Q
mlx-community
6,015
5
Llama 3 8B Instruct Abliterated TR
LLaMA-3-8B-Instruct的消融版本,通过特定技术手段强制模型用土耳其语响应
大型语言模型 Transformers 其他
L
Metin
25
5
Bitnet B1.58 2B 4T GGUF
MIT
微软开发的1.58位量化大语言模型,专为高效推理设计,提供IQ2_BN和IQ2_BN_R4两种量化版本
大型语言模型
B
tdh111
1,058
4
Granite 3.3 8b Instruct Q8 0 GGUF
Apache-2.0
该模型是基于IBM Granite-3.3-8B指令微调模型转换而来的GGUF格式模型,适用于文本生成任务。
大型语言模型
G
NikolayKozloff
36
2
Gemma 2 2b It Tool Think
MIT
基于google/gemma-2b-it微调的文本生成模型,支持工具调用思考过程
大型语言模型 Transformers
G
langdai
36
2
Qwen2.5 0.5B Instruct
Apache-2.0
专为Gensyn强化学习群设计的0.5B参数指令微调模型,支持本地微调训练
大型语言模型 Transformers 英语
Q
Gensyn
2.4M
5
T0 S1 14B
Qwen2.5-14B-Instruct 是基于 Qwen2.5 架构的 140 亿参数指令微调大语言模型,在 s1K 数据集上进行了微调优化。
大型语言模型 Transformers
T
TomasLaz
47
2
Orpheus 3b 0.1 Ft Q6 K GGUF
Apache-2.0
这是一个基于canopylabs/orpheus-3b-0.1-ft转换的GGUF格式模型,适用于文本转语音任务。
大型语言模型 英语
O
TheVisitorX
191
0
Cisimi V0.1
CiSiMi是一个早期的文本转音频模型原型,专为资源受限环境设计,能够在CPU上高效运行,实现高级语音合成。
语音合成 英语
C
KandirResearch
202
7
Gemma 3 12b It Q5 K S GGUF
这是Google Gemma 3B模型的GGUF量化版本,适用于本地推理,支持文本生成任务。
大型语言模型
G
NikolayKozloff
16
1
Gemma 3 27b It Q4 K M GGUF
该模型是基于Google的Gemma 3 27B IT模型转换而来的GGUF格式版本,适用于本地推理。
大型语言模型
G
paultimothymooney
299
2
Llama Joycaption Alpha Two Hf Llava FP8 Dynamic
MIT
这是对fancyfeast开发的Llama JoyCaption Alpha Two模型进行的FP8压缩版本,使用llm-compressor工具实现,并兼容vllm框架。
图像生成文本 英语
L
JKCHSTR
248
1
Deepseek R1 Distill Llama 70B GGUF
DeepSeek-R1-Distill-Llama-70B是DeepSeek团队基于Llama架构开发的70B参数大语言模型,通过蒸馏技术优化,支持高效推理和微调。
大型语言模型 英语
D
unsloth
11.51k
79
Deepseek R1 Distill Llama 8B GGUF
DeepSeek-R1是基于Llama架构的8B参数推理模型,采用1.58位+2位动态量化技术提升精度
大型语言模型 英语
D
unsloth
37.60k
266
Internlm3 8b Instruct Gguf
Apache-2.0
InternLM3-8B-Instruct 模型的 GGUF 格式版本,适用于 llama.cpp 框架,支持多种量化版本。
大型语言模型 英语
I
internlm
1,072
26
Tanuki 8B Dpo V1.0
Apache-2.0
Tanuki-8B是一个8B参数的日语大语言模型,经过SFT和DPO优化对话任务,由GENIAC松尾研究室开发
大型语言模型 Transformers 支持多种语言
T
weblab-GENIAC
1,143
41
Meta Llama 3.1 8B Instruct GGUF
Llama-3.1-8B-Instruct 是由 Meta 发布的一个 8B 参数规模的大语言模型,专注于指令跟随任务。
大型语言模型
M
DevQuasar
485
3
Llama 3 Firefunction V2
FireFunction V2 是一款具有商业可行许可的最先进函数调用模型,基于 Llama 3 训练,支持并行函数调用和良好的指令遵循。
大型语言模型 Transformers
L
fireworks-ai
1,361
145
Wizardlm 2 7B Abliterated
Apache-2.0
WizardLM-2-7B的消融版本,经过正交化处理以优化特定行为模式
大型语言模型 Transformers
W
fearlessdots
237
14
Verius LLM 8b V0.2
VeriUS LLM 是一款基于 llama3-8B、支持土耳其语的指令跟随大语言模型
大型语言模型 Transformers
V
VeriUs
2,763
4
Llama 3 Korean 8B
基于Bllossom 8B模型微调的韩语大语言模型,支持安全对话生成
大型语言模型 Transformers
L
sh2orc
1,793
2
Mistral 7B Banking V2
Apache-2.0
基于Mistral-7B微调的银行业务专用大语言模型,专注于银行交易和客户支持场景
大型语言模型 Transformers
M
bitext
97
1
Llama 3 8B Instruct 64k
基于 winglian/Llama-3-8b-64k-PoSE 开发的 8B 参数大语言模型,采用 PoSE 技术扩展上下文长度至 64k,并经过 DPO 微调优化
大型语言模型 Transformers 英语
L
MaziyarPanahi
91
12
Llama 3 8b It Ko Chang
Apache-2.0
基于Meta-Llama-3-8B-Instruct的韩语指令调优版本,专门优化了韩语理解和生成能力
大型语言模型 Transformers 韩语
L
lcw99
18
10
Dolphinhermespro ModelStock
Apache-2.0
该模型是通过懒人合并工具包合并Dolphin-2.8和Hermes-2-Pro两个7B参数模型而成的混合模型,基于Mistral-7B架构。
大型语言模型 Transformers
D
Kquant03
14
1
Minicpm MoE 8x2B
MiniCPM-MoE-8x2B是一款基于Transformer架构的混合专家(MoE)语言模型,采用8个专家模块设计,每个token激活2个专家进行处理。
大型语言模型 Transformers
M
openbmb
6,377
41
Mistral 7B OpenOrca Q4 K M GGUF
Apache-2.0
该模型是基于Open-Orca/Mistral-7B-OpenOrca转换而来的GGUF格式模型,适用于文本生成任务。
大型语言模型 英语
M
munish0838
81
2
Breeze 7B Instruct V1 0
Apache-2.0
Breeze-7B-Instruct是基于Mistral-7B构建的繁体中文优化语言模型,专为指令跟随任务设计,支持问答、多轮对话等场景。
大型语言模型 Transformers 支持多种语言
B
MediaTek-Research
1,388
61
Mistral 7B Instruct V0.2 Sparsity 20 V0.1
Apache-2.0
Mistral-7B-Instruct-v0.2是基于Mistral-7B-Instruct-v0.1改进的指令微调大语言模型,采用Wanda剪枝方法压缩至2%稀疏度,无需重新训练即可保持竞争力性能。
大型语言模型 Transformers
M
wang7776
80
1
Mistral 7B Instruct V0.2
Apache-2.0
Mistral-7B-Instruct-v0.2是基于Mistral-7B-v0.2进行指令微调的大语言模型,支持32k上下文窗口,移除了滑动窗口注意力机制。
大型语言模型 Transformers
M
mistralai
1.1M
2,737
Sciphi Mistral 7B 32k
MIT
基于Mistral-7B-v0.1微调的大型语言模型,专注于提升科学推理与教育能力
大型语言模型 Transformers
S
SciPhi
143
72
Codellama 13b Oasst Sft V10
基于Meta的CodeLlama 13B大语言模型进行Open-Assistant微调的版本,支持英语,采用新的RoPE Theta值(1e6替代1e4)。
大型语言模型 Transformers 英语
C
OpenAssistant
159
69
Mythomax L2 13B GPTQ
其他
MythoMax L2 13B是由Gryphe开发的大语言模型,基于Llama 2架构,专注于角色扮演和创意文本生成。
大型语言模型 Transformers 英语
M
TheBloke
5,324
204
Vicuna 7b V1.5
Vicuna 是基于 Llama 2 微调训练而成的聊天助手,训练数据来源于 ShareGPT 的用户共享对话。
大型语言模型 Transformers
V
lmsys
255.23k
335
BELLE 7B 2M
Apache-2.0
BELLE是基于Bloomz-7b1-mt模型微调的中英文指令理解与生成模型,具备优秀的中文处理能力
大型语言模型 Transformers 支持多种语言
B
BelleGroup
55
186
Gpt2 Model De
这是一个基于GPT-2架构的德语语言模型,专门针对德语文本生成任务进行了训练。
大型语言模型 Transformers 德语
G
Tanhim
18
3
Distilbert Base Squad2 Custom Dataset
基于Distilbert_Base微调的SQuAD2.0及自定义问答数据集模型,专注于高效问答任务
问答系统 Transformers
D
superspray
17
0
Bert Italian Finedtuned Squadv1 It Alfa
意大利语BERT基础版在意大利语SQuAD上微调,用于问答下游任务
问答系统 其他
B
mrm8488
286
14
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase