Qwen3 4B Base
Apache-2.0
Qwen3-4B-Base是通义千问系列最新一代40亿参数量的预训练语言模型,支持32k上下文长度和多语言处理。
大型语言模型
Transformers

Q
unsloth
15.15k
1
Qwen3 0.6B Base
Apache-2.0
Qwen3是通义千问系列最新一代6亿参数大语言模型,支持32k上下文长度,覆盖119种语言
大型语言模型
Transformers

Q
Qwen
58.85k
44
Llama 1B GRPO Final
GSM8K 是一个包含8.5K个高质量小学数学问题的数据集,用于评估模型的数学推理能力。
问答系统
Transformers

L
NickyNicky
437
4
Linkbricks Horizon AI Japanese Superb V4 70B
Apache-2.0
由Linkbricks Horizon - AI开发的日语强化语言模型,基于70B参数规模,支持日、韩、中、英多语言处理,擅长逻辑推理和跨语言任务。
大型语言模型
Transformers 支持多种语言

L
Saxo
912
6
Flan T5 Base Q4 K M GGUF
Apache-2.0
该模型是基于Google的flan-t5-base模型转换而来的GGUF格式版本,支持多种语言和任务,适用于文本生成和推理任务。
大型语言模型 支持多种语言
F
marroyo777
23
1
Deberta Base Long Nli
Apache-2.0
基于DeBERTa-v3-base模型,上下文长度扩展至1280,并在tasksource数据集上进行了25万步的微调,专注于自然语言推理和零样本分类任务。
大型语言模型
Transformers

D
tasksource
541
23
Deberta Small Long Nli
Apache-2.0
基于DeBERTa-v3-small模型,扩展上下文长度至1680标记,在tasksource数据集上微调,适用于长文本自然语言推理任务
大型语言模型
Transformers 支持多种语言

D
tasksource
40.85k
42
Chronos 13b V2
基于LLaMA v2基础模型的13B参数版本,擅长聊天、角色扮演和故事创作,具备出色的推理和逻辑能力。
大型语言模型
Transformers

C
elinas
890
26
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98