多轮对话支持

# 多轮对话支持

Qwen3 8B Q4 K M GGUF

这是Qwen3-8B模型的GGUF格式版本，适用于llama.cpp框架，支持文本生成任务。

大型语言模型

Qwen3 1.7B 4bit

Qwen3-1.7B-4bit是通义千问1.7B模型的4位量化版本，已转换为MLX框架格式，便于在Apple Silicon设备上高效运行。

大型语言模型

Qwen3 0.6B 4bit

这是一个基于Qwen/Qwen3-0.6B模型转换的4位量化版本，适用于MLX框架的高效推理。

大型语言模型

Llama 3 8B Instruct Abliterated TR

LLaMA-3-8B-Instruct的消融版本，通过特定技术手段强制模型用土耳其语响应

大型语言模型

Transformers 其他

Bitnet B1.58 2B 4T GGUF

微软开发的1.58位量化大语言模型，专为高效推理设计，提供IQ2_BN和IQ2_BN_R4两种量化版本

大型语言模型

Granite 3.3 8b Instruct Q8 0 GGUF

该模型是基于IBM Granite-3.3-8B指令微调模型转换而来的GGUF格式模型，适用于文本生成任务。

大型语言模型

Gemma 2 2b It Tool Think

基于google/gemma-2b-it微调的文本生成模型，支持工具调用思考过程

大型语言模型

Qwen2.5 0.5B Instruct

专为Gensyn强化学习群设计的0.5B参数指令微调模型，支持本地微调训练

大型语言模型

Transformers 英语

Qwen2.5-14B-Instruct 是基于 Qwen2.5 架构的 140 亿参数指令微调大语言模型，在 s1K 数据集上进行了微调优化。

大型语言模型

Orpheus 3b 0.1 Ft Q6 K GGUF

这是一个基于canopylabs/orpheus-3b-0.1-ft转换的GGUF格式模型，适用于文本转语音任务。

大型语言模型英语

CiSiMi是一个早期的文本转音频模型原型，专为资源受限环境设计，能够在CPU上高效运行，实现高级语音合成。

语音合成英语

Gemma 3 12b It Q5 K S GGUF

这是Google Gemma 3B模型的GGUF量化版本，适用于本地推理，支持文本生成任务。

大型语言模型

Gemma 3 27b It Q4 K M GGUF

该模型是基于Google的Gemma 3 27B IT模型转换而来的GGUF格式版本，适用于本地推理。

大型语言模型

paultimothymooney

Llama Joycaption Alpha Two Hf Llava FP8 Dynamic

这是对fancyfeast开发的Llama JoyCaption Alpha Two模型进行的FP8压缩版本，使用llm-compressor工具实现，并兼容vllm框架。

图像生成文本英语

Deepseek R1 Distill Llama 70B GGUF

DeepSeek-R1-Distill-Llama-70B是DeepSeek团队基于Llama架构开发的70B参数大语言模型，通过蒸馏技术优化，支持高效推理和微调。

大型语言模型英语

Deepseek R1 Distill Llama 8B GGUF

DeepSeek-R1是基于Llama架构的8B参数推理模型，采用1.58位+2位动态量化技术提升精度

大型语言模型英语

Internlm3 8b Instruct Gguf

InternLM3-8B-Instruct 模型的 GGUF 格式版本，适用于 llama.cpp 框架，支持多种量化版本。

大型语言模型英语

Tanuki 8B Dpo V1.0

Tanuki-8B是一个8B参数的日语大语言模型，经过SFT和DPO优化对话任务，由GENIAC松尾研究室开发

大型语言模型

Transformers 支持多种语言

Meta Llama 3.1 8B Instruct GGUF

Llama-3.1-8B-Instruct 是由 Meta 发布的一个 8B 参数规模的大语言模型，专注于指令跟随任务。

大型语言模型

Llama 3 Firefunction V2

FireFunction V2 是一款具有商业可行许可的最先进函数调用模型，基于 Llama 3 训练，支持并行函数调用和良好的指令遵循。

大型语言模型

Wizardlm 2 7B Abliterated

WizardLM-2-7B的消融版本，经过正交化处理以优化特定行为模式

大型语言模型

Verius LLM 8b V0.2

VeriUS LLM 是一款基于 llama3-8B、支持土耳其语的指令跟随大语言模型

大型语言模型

Llama 3 Korean 8B

基于Bllossom 8B模型微调的韩语大语言模型，支持安全对话生成

大型语言模型

Mistral 7B Banking V2

基于Mistral-7B微调的银行业务专用大语言模型，专注于银行交易和客户支持场景

大型语言模型

Llama 3 8B Instruct 64k

基于 winglian/Llama-3-8b-64k-PoSE 开发的 8B 参数大语言模型，采用 PoSE 技术扩展上下文长度至 64k，并经过 DPO 微调优化

大型语言模型

Transformers 英语

Llama 3 8b It Ko Chang

基于Meta-Llama-3-8B-Instruct的韩语指令调优版本，专门优化了韩语理解和生成能力

大型语言模型

Transformers 韩语

Dolphinhermespro ModelStock

该模型是通过懒人合并工具包合并Dolphin-2.8和Hermes-2-Pro两个7B参数模型而成的混合模型，基于Mistral-7B架构。

大型语言模型

Minicpm MoE 8x2B

MiniCPM-MoE-8x2B是一款基于Transformer架构的混合专家（MoE）语言模型，采用8个专家模块设计，每个token激活2个专家进行处理。

大型语言模型

Mistral 7B OpenOrca Q4 K M GGUF

该模型是基于Open-Orca/Mistral-7B-OpenOrca转换而来的GGUF格式模型，适用于文本生成任务。

大型语言模型英语

Breeze 7B Instruct V1 0

Breeze-7B-Instruct是基于Mistral-7B构建的繁体中文优化语言模型，专为指令跟随任务设计，支持问答、多轮对话等场景。

大型语言模型

Transformers 支持多种语言

MediaTek-Research

Mistral 7B Instruct V0.2 Sparsity 20 V0.1

Mistral-7B-Instruct-v0.2是基于Mistral-7B-Instruct-v0.1改进的指令微调大语言模型，采用Wanda剪枝方法压缩至2%稀疏度，无需重新训练即可保持竞争力性能。

大型语言模型

Mistral 7B Instruct V0.2

Mistral-7B-Instruct-v0.2是基于Mistral-7B-v0.2进行指令微调的大语言模型，支持32k上下文窗口，移除了滑动窗口注意力机制。

大型语言模型

Sciphi Mistral 7B 32k

基于Mistral-7B-v0.1微调的大型语言模型，专注于提升科学推理与教育能力

大型语言模型

Codellama 13b Oasst Sft V10

基于Meta的CodeLlama 13B大语言模型进行Open-Assistant微调的版本，支持英语，采用新的RoPE Theta值（1e6替代1e4）。

大型语言模型

Transformers 英语

Mythomax L2 13B GPTQ

MythoMax L2 13B是由Gryphe开发的大语言模型，基于Llama 2架构，专注于角色扮演和创意文本生成。

大型语言模型

Transformers 英语

Vicuna 是基于 Llama 2 微调训练而成的聊天助手，训练数据来源于 ShareGPT 的用户共享对话。

大型语言模型

BELLE是基于Bloomz-7b1-mt模型微调的中英文指令理解与生成模型，具备优秀的中文处理能力

大型语言模型

Transformers 支持多种语言

这是一个基于GPT-2架构的德语语言模型，专门针对德语文本生成任务进行了训练。

大型语言模型

Transformers 德语

Distilbert Base Squad2 Custom Dataset

基于Distilbert_Base微调的SQuAD2.0及自定义问答数据集模型，专注于高效问答任务

Bert Italian Finedtuned Squadv1 It Alfa

意大利语BERT基础版在意大利语SQuAD上微调，用于问答下游任务

问答系统其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase