Falcon H1 34B Instruct
其他
Falcon-H1是由TII开发的高效混合架构语言模型,结合了Transformers和Mamba架构的优势,支持英语和多语言任务。
大型语言模型
Transformers

F
tiiuae
2,454
28
Qwen3 14B Base Unsloth Bnb 4bit
Apache-2.0
Qwen3-14B-Base是通义千问系列最新一代大语言模型,提供148亿参数的稠密模型,支持32k上下文长度,覆盖119种语言。
大型语言模型
Transformers

Q
unsloth
2,120
1
Qwen3 14B Base
Apache-2.0
Qwen3-14B-Base是通义系列最新一代大语言模型,提供了一套全面的密集和混合专家(MoE)模型,在训练数据、模型架构和优化技术方面有显著改进。
大型语言模型
Transformers

Q
unsloth
4,693
1
Qwen3 4B Base
Apache-2.0
Qwen3-4B-Base是通义千问系列最新一代40亿参数量的预训练语言模型,支持32k上下文长度和多语言处理。
大型语言模型
Transformers

Q
unsloth
15.15k
1
Qwen3 1.7B Base Unsloth Bnb 4bit
Apache-2.0
Qwen3-1.7B-Base是通义千问系列最新一代大语言模型,提供高质量的预训练语言模型能力。
大型语言模型
Transformers

Q
unsloth
689
1
Qwen3 1.7B Base
Apache-2.0
Qwen3-1.7B-Base是通义系列最新一代大语言模型,提供了一系列密集模型和专家混合(MoE)模型,在训练数据、模型架构和优化技术等方面进行了大量改进。
大型语言模型
Transformers

Q
unsloth
7,444
2
Qwen3 0.6B Base Unsloth Bnb 4bit
Apache-2.0
Qwen3-0.6B-Base是通义系列最新一代大语言模型,具有0.6B参数规模,支持119种语言,上下文长度达32,768标记。
大型语言模型
Transformers

Q
unsloth
10.84k
1
Qwen3 0.6B Base
Apache-2.0
Qwen3-0.6B-Base是通义千问系列的最新一代大语言模型,提供了一系列密集模型和混合专家(MoE)模型。
大型语言模型
Transformers

Q
unsloth
10.84k
2
Qwen3 14B Base
Apache-2.0
通义千问系列最新一代大语言模型,提供148亿参数的预训练基础模型,支持32k超长上下文理解
大型语言模型
Transformers

Q
Qwen
9,718
21
Qwen3 8B Base
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的稠密模型与混合专家(MoE)模型体系,覆盖119种语言的36万亿token预训练数据。
大型语言模型
Transformers

Q
Qwen
26.79k
26
Emma 500 Llama2 7b
EMMA-500 是基于 Llama 2 7B 架构的多语言大语言模型,支持 500 多种语言,在常识推理、机器翻译等任务中表现卓越。
大型语言模型
Transformers

E
MaLA-LM
65
14
360zhinao3 7B O1.5
Apache-2.0
360智脑3-7B-O1.5是奇虎360开源的长思维链模型,基于360智脑3-7B-Instruct微调,支持复杂推理任务。
大型语言模型
Transformers 支持多种语言

3
qihoo360
35
3
Qwen2.5 72B Instruct GGUF
其他
Qwen2.5-72B-Instruct的GGUF量化版本,支持多种精度格式,适用于不同硬件环境的高效推理。
大型语言模型 英语
Q
Mungert
1,439
4
Llama 3.3 70B Instruct Quantized.w4a16
基于Meta-Llama-3.1架构的量化优化模型,支持多语言,适用于商业和研究场景,在减少资源需求的同时保持高性能。
大型语言模型
Transformers 支持多种语言

L
RedHatAI
19.25k
1
Llamax3 8B Alpaca
MIT
LLaMAX是一款具备强大多语言能力的语言模型,支持超100种语言的翻译,性能超越同等规模的大语言模型。
大型语言模型
Transformers

L
LLaMAX
1,488
26
Hebrew Gemma 11B V2
其他
Hebrew-Gemma-11B-V2 是一个开源的希伯来语/英语预训练生成文本大语言模型,拥有110亿参数,基于Google的Gemma-7B架构。
大型语言模型
Transformers 支持多种语言

H
yam-peleg
5,292
13
Typhoon 7b Instruct 02 19 2024
Apache-2.0
Typhoon-0219是基于Typhoon 7B开发的指令微调泰语大语言模型,参数量达70亿,支持泰语和英语,专为指令响应优化。
大型语言模型
Transformers

T
scb10x
94
2
Koalpaca Polyglot 12.8B
Apache-2.0
基于EleutherAI/polyglot-ko-12.8b在韩国羊驼数据集v1.1b上微调的多语言韩文生成模型
大型语言模型
Transformers 韩语

K
beomi
3,998
56
Llama 7b Hf
其他
LLaMA是由Meta AI开发的开放高效基础语言模型,提供7B参数版本,支持20种语言,专注于自然语言处理研究。
大型语言模型
Transformers

L
yahma
22.30k
85
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98