Gemma 3n E2B It
Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建。支持文本、音频和视觉输入,适用于多种任务。
图像生成文本
Transformers

G
google
1,183
26
Gemma 3 27b It Qat Q4 0 Unquantized
Gemma 3是Google推出的轻量级、先进的多模态开放模型,基于与Gemini模型相同的研究和技术构建,支持文本和图像输入并生成文本输出。
文本生成图像
Transformers

G
google
11.53k
23
Gemma 3 12b It Qat Q4 0 Gguf
Gemma 3是谷歌基于Gemini技术构建的轻量级开放模型,支持文本和图像输入,生成文本输出。12B版本经过指令调优,适用于多种生成和理解任务。
图像生成文本
G
vinimuchulski
1,860
4
Gemma 3 4b It Quantized W4A16
Gemma 3是Google开发的轻量级开源大语言模型,本仓库提供其4B参数版本的W4A16量化模型,显著降低硬件需求。
大型语言模型
Transformers

G
abhishekchohan
592
2
Gemma 3 12b It Qat Q4 0 Gguf
Gemma 3是谷歌推出的轻量级尖端开源多模态模型,支持图文输入与文本输出,具有128K上下文窗口和140+语言支持。
图像生成文本
G
google
40.86k
109
Gemma 3 1b It
Gemma 3是Google推出的轻量级先进开放模型系列,基于与Gemini模型相同的研究和技术构建。该模型是多模态模型,能够处理文本和图像输入并生成文本输出。
文本生成图像
Transformers

G
google
2.1M
347
Modernbert Large Nli
Apache-2.0
基于ModernBERT-large模型,通过多任务微调优化的自然语言推理模型,在零样本分类和NLI任务上表现优异。
大型语言模型
Transformers 支持多种语言

M
tasksource
61.52k
5
Llama 3.1 Swallow 70B Instruct V0.3
Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列,通过持续预训练增强了日语能力,同时保留英文能力。
大型语言模型
Transformers 支持多种语言

L
tokyotech-llm
1,659
12
Llama SEA LION V3 70B IT
SEA-LION 是一个针对东南亚语言优化的大语言模型系列,支持13种东南亚语言,基于Llama 3.1架构构建。
大型语言模型
Transformers 支持多种语言

L
aisingapore
2,672
2
Llama 3 ELYZA JP 8B
由ELYZA公司训练的大型语言模型,基于Meta-Llama-3-8B-Instruct增强日语能力
大型语言模型
Transformers 支持多种语言

L
elyza
13.52k
113
Gemma 2 27b It
Gemma是Google推出的轻量级开源大语言模型系列,基于创建Gemini模型的相同技术构建,适用于多种文本生成任务。
大型语言模型
Transformers

G
google
160.10k
543
It 5.3 Fp16 32k
Apache-2.0
旋风0.5*是一个支持俄语和英语的开源大语言模型,扩展了RoPE上下文窗口至32k,优化了JSON处理和多轮对话能力
大型语言模型
Transformers 支持多种语言

I
Vikhrmodels
74
11
Codegemma 1.1 2b
CodeGemma是基于Gemma构建的轻量级开源代码模型集合,支持代码补全、生成和对话等多种任务。
大型语言模型
Transformers

C
google
426
18
Meta Llama 3 70B Instruct AWQ
其他
Meta-Llama-3-70B-Instruct是Meta发布的70B参数规模的指令调优大语言模型,针对对话用例优化,在安全性和帮助性方面表现突出。
大型语言模型
Transformers 英语

M
TechxGenus
210
12
Openelm 450M Instruct
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,包含2.7亿至30亿参数的预训练及指令调优版本。
大型语言模型
Transformers

O
apple
114.41k
47
Openelm 270M Instruct
OpenELM是一系列开放、高效的语言模型,采用逐层缩放策略在Transformer模型的每一层内高效分配参数,提高了准确性。
大型语言模型
Transformers

O
apple
1,593
138
Openelm 270M
OpenELM是一组开源高效语言模型,采用分层缩放策略在Transformer模型的每一层中高效分配参数,提升准确性。
大型语言模型
Transformers

O
apple
4,719
74
Gemma 1.1 7b It
Gemma是Google推出的轻量级开放模型系列,基于与Gemini相同技术构建,适用于文本生成任务。
大型语言模型
Transformers

G
google
17.43k
271
Codegemma 7b It
CodeGemma是基于Gemma构建的轻量级开源代码模型集合,专长于代码生成、补全和对话任务。
大型语言模型
Transformers

C
google
3,286
217
Codegemma 7b It GGUF
CodeGemma是基于Gemma构建的轻量级开源代码模型系列,专注于代码补全、生成和对话任务。
大型语言模型
C
google
46
56
Codellama 13b Instruct Hf
Code Llama是Meta发布的预训练生成文本模型系列,专注于代码生成与理解,包含70亿至340亿参数的不同版本。
大型语言模型
Transformers 其他

C
meta-llama
2,307
22
Cendol Llama2 7b Chat
Apache-2.0
仙都(Cendol)是一个开源的、针对印尼语进行微调的生成式大语言模型集合,涵盖多种架构和参数规模。
大型语言模型
Transformers 其他

C
indonlp
1,749
2
Swallow 70b Hf
基于Llama 2系列增强日语能力的开源大语言模型,提供7B/13B/70B三种规模及指令调优版本
大型语言模型
Transformers 支持多种语言

S
tokyotech-llm
2,088
10
Llama2 MedTuned 7b
Apache-2.0
基于Llama2 7B模型进行指令调优的生物医学领域专用模型
大型语言模型
Transformers

L
nlpie
444
11
Codellama 13b Instruct Hf
CodeLlama-13b-Instruct是Meta发布的130亿参数指令调优代码生成模型,专为安全指令跟随和代码助手应用设计
大型语言模型
Transformers 其他

C
codellama
206.94k
147
Gpt2 Open Instruct V1
MIT
这是一个基于open-instruct-v1数据集微调的GPT2模型,采用羊驼格式的提示模板进行指令调优。
大型语言模型
Transformers 英语

G
vicgalle
2,124
34
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98