INTELLECT 2 GGUF
Apache-2.0
INTELLECT 2是由PrimeIntellect推出的大语言模型,支持40960 tokens的上下文长度,采用QwQ架构和GRPO强化学习框架训练。
大型语言模型
I
lmstudio-community
467
5
Apriel 5B Instruct Llamafied
MIT
这是一个基于ServiceNow-AI的Apriel-5B-Instruct模型转换为Llama格式的近似实现版本,兼容主流微调框架,运行更简便。
大型语言模型
Transformers

A
mrfakename
63
3
Orpogemma 2 9B TR
OrpoGemma-2-9B-TR 是谷歌 Gemma-2-9B-IT 模型的土耳其语微调版本,专为土耳其语文本生成优化。
大型语言模型
Transformers 其他

O
selimc
4,342
7
Pygmalion 3 12B
Apache-2.0
Pygmalion-3 12B 是基于 Mistral-Nemo-Base-2407-chatml 微调的开源角色扮演大模型,专注于生成富有创意的虚构对话内容。
大型语言模型
Transformers

P
PygmalionAI
741
43
Sarashina2 7b
MIT
由SB Intuitions训练的大型日语/英语双语语言模型,基于Llama2架构
大型语言模型
Transformers 支持多种语言

S
sbintuitions
1,561
27
EEVE Korean Instruct 10.8B V1.0 Gguf
Apache-2.0
EEVE-Korean-Instruct-10.8B-v1.0 是一个韩语指令微调的大型语言模型,基于 yanolja/EEVE-Korean-10.8B-v1.0 基础模型开发,专注于韩语理解和生成任务。
大型语言模型
E
teddylee777
626
21
Taiwan LLM 7B V2.0.1 Chat GGUF
Apache-2.0
专为繁体中文优化的先进语言模型,深度聚焦台湾地区的语言文化语境,在语言理解与生成任务中表现卓越
大型语言模型 中文
T
ZoneTwelve
590
2
Mistral 7B Customer Support
Apache-2.0
基于Mistral-7B-Instruct微调的客户支持领域专用模型,优化用于处理各类客服对话场景
大型语言模型
Transformers

M
bitext
487
12
Turkish Gpt2 Medium 350m Instruct V0.1
MIT
基于ytu-ce-cosmos/turkish-gpt2-medium开发的土耳其语言模型,通过3.5万条指令数据集微调,适用于多种文本生成任务
大型语言模型
Transformers 其他

T
ytu-ce-cosmos
899
12
JARVIS
Apache-2.0
基于因果语言建模(CLM)架构的对话AI,专为自然语言交互设计,能够生成连贯且符合上下文的响应。
大型语言模型
Transformers 支持多种语言

J
VAIBHAV22334455
38
12
Turkish Gpt2 Large 750m Instruct V0.1
MIT
基于ytu-ce-cosmos/turkish-gpt2-large开发的土耳其语指令微调语言模型,通过3.5万条指令数据集微调
大型语言模型
Transformers 其他

T
ytu-ce-cosmos
2,980
40
EEVE Korean Instruct 10.8B V1.0
Apache-2.0
基于SOLAR-10.7B-v1.0的韩语词汇扩展版,经过DPO微调的大语言模型
大型语言模型
Transformers

E
yanolja
19.39k
154
Synthia 70B V1.5
Synthia-70B-v1.5是一个700亿参数的大型语言模型,基于Llama2架构构建,专注于通过思维树方法进行复杂推理和连贯回答。
大型语言模型
Transformers

S
migtissera
99
42
Mistral 7B Instruct V0.1 Sharded
Apache-2.0
Mistral-7B-Instruct-v0.1是基于Mistral-7B-v0.1的指令微调版本,适用于对话生成任务。
大型语言模型
Transformers

M
filipealmeida
1,363
14
Japanese Stablelm Instruct Alpha 7b
其他
基于70亿参数解码器的日语指令微调语言模型,适用于生成类任务
大型语言模型
Transformers 日语

J
stabilityai
578
96
Fastchat T5 3b V1.0
Apache-2.0
FastChat-T5是一款基于Flan-t5-xl微调的开源聊天机器人,采用编码器-解码器架构,支持自回归生成对话响应。
大型语言模型
Transformers

F
lmsys
1,177
365
Oasst Sft 4 Pythia 12b Epoch 3.5
Apache-2.0
基于Pythia 12B架构的英文监督微调模型,通过Open-Assistant项目的人类反馈数据训练,专注于对话生成任务。
大型语言模型
Transformers 英语

O
OpenAssistant
24.47k
367
Rugpt Chitchat
一个支持俄语闲聊对话和常识推理的生成模型,基于GPT-2架构
大型语言模型
Transformers 其他

R
inkoziev
70
18
Blenderbot 1B Distill
Apache-2.0
该模型是一个高性能的开放领域聊天机器人,能够融合多项对话技能,如提问、回答、展现知识和同理心等。
对话系统
Transformers 英语

B
facebook
2,413
37
Dialogpt Medium JAB
DialoGPT 是微软推出的一个基于 GPT-2 的对话生成模型,中型 JAB 版本是其参数规模适中的变体,适用于生成连贯且上下文相关的对话回复。
对话系统
Transformers

D
chan030609
22
0
Blenderbot Small 90M
Apache-2.0
这是一个基于大规模神经网络的开放域对话系统,能够进行多轮自然对话并融合多种对话技能。
对话系统 英语
B
facebook
2,407
49
Dialogpt Small
MIT
DialoGPT是一个最先进的大规模预训练的多轮对话响应生成模型,在单轮对话图灵测试下,其生成的响应质量可以与人类响应质量相媲美。
对话系统
D
microsoft
218.89k
123
Dialogpt Medium
MIT
DialoGPT 是一个用于多轮对话的大规模预训练对话响应生成模型,在单轮对话图灵测试中表现与人类相当。
对话系统
D
microsoft
267.59k
368
Dialogpt Large
MIT
DialoGPT 是一个针对多轮对话的前沿大规模预训练对话响应生成模型,在单轮对话图灵测试中生成的响应质量与人类回答相当。
对话系统
D
microsoft
49.90k
276
Dialogpt For French Language
这是一个基于DialoGPT进行法语微调的对话代理模型,旨在支持法语对话任务。
大型语言模型
Transformers 法语

D
emil2000
42
1
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98