TY Ecomm Embed Multilingual Base V1.2.0
Apache-2.0
GTE-Multilingual-Base 是一个多语言句子嵌入模型,支持多种语言的句子相似度计算。
文本嵌入 支持多种语言
T
Trendyol
790
25
Emma 500 Llama2 7b
EMMA-500 是基于 Llama 2 7B 架构的多语言大语言模型,支持 500 多种语言,在常识推理、机器翻译等任务中表现卓越。
大型语言模型
Transformers

E
MaLA-LM
65
14
Nllb1.3 Smugri4 V0.01
这是对NLLB-1.3b模型针对29种芬兰-乌戈尔语族语言的平行数据进行微调的版本,支持多种方言/变体生成。
机器翻译
Transformers 支持多种语言

N
tartuNLP
39
2
Seallms Audio 7B
其他
SeaLLMs-Audio是面向东南亚的大规模音频语言模型,支持印尼语、泰语、越南语、英语和中文五大语种,具备音频分析、语音交互等能力。
音频生成文本 支持多种语言
S
SeaLLMs
539
10
Khmer Sentiment Xlm Roberta Base
MIT
针对高棉语金融文本优化的情感分析模型,可分类积极/消极情感
文本分类
Transformers 其他

K
songhieng
31
1
Stt Bm Quartznet15x5 V0
这是一个基于NVIDIA NeMo框架微调的班巴拉语自动语音识别模型,适用于处理班巴拉语语音转文本任务。
语音识别 其他
S
RobotsMali
88
1
Asr Whisper Large V3 Salt
基于whisper-large-v3适配的语音识别模型,专门针对乌干达地区多种语言优化
语音识别
Transformers 支持多种语言

A
Sunbird
249
1
Chitrarth
其他
Chitrarth是一个多语言视觉语言模型,旨在连接视觉与语言,特别关注印度多种语言的支持。
图像生成文本 支持多种语言
C
krutrim-ai-labs
410
11
Fish Speech 1.5 Ukrainian
基于Fish Speech 1.5微调的乌克兰语专用语音合成模型,支持55位说话人的高质量语音生成
语音合成 其他
F
skypro1111
43
4
En To Dzo Nllb Mul Mt Nlp M4
该模型是基于facebook/nllb-200-distilled-600M微调的英语到宗喀语(Dzongkha)翻译模型
机器翻译
Transformers

E
Zeref02210217-cst
22
1
Whisper Small Uzbek
Apache-2.0
基于OpenAI Whisper-small微调的乌兹别克语自动语音识别模型,在Common Voice 17.0数据集上训练
语音识别
Transformers 其他

W
abduaziz
20
2
Llama SEA LION V3 8B
Llama-SEA-LION-v3-8B 是一个针对东南亚语言优化的多语言大语言模型,支持11种东南亚语言,并在约2000亿个标记上进行了持续预训练。
大型语言模型
Transformers 支持多种语言

L
aisingapore
1,964
2
Oolel V0.1
Apache-2.0
首个高性能沃洛夫语开源语言模型,基于Qwen 2.5架构打造,支持沃洛夫语与英语的双向翻译、文本生成等任务
大型语言模型
Transformers 支持多种语言

O
soynade-research
145
17
F15
鱼语语音 V1.5 是一款领先的文本转语音(TTS)模型,基于超过100万小时的多语言音频数据训练而成。
语音合成 支持多种语言
F
cocktailpeanut
5,162
0
Nllb 200 Distilled 600M Ctranslate2
NLLB-200是一个支持200种语言的神经机器翻译模型,特别关注低资源语言的翻译质量。
机器翻译 支持多种语言
N
entai2965
37
1
Nllb 200 3.3B Ctranslate2
NLLB-200是一个支持200种语言的神经机器翻译模型,专注于低资源语言的翻译研究。
机器翻译 支持多种语言
N
entai2965
25
2
Openlid V2
Gpl-3.0
OpenLID-v2是一个高覆盖、高性能的语言识别模型,支持200种语言变体,是OpenLID的改进版本。
文本分类
O
laurievb
273
2
Madlad400 7b Mt Bt Q4 K M GGUF
Apache-2.0
一个支持超过150种语言的多语言处理模型,适用于多种自然语言处理任务。
大型语言模型 支持多种语言
M
brauliobo
22
1
Jina Embeddings V3
Jina Embeddings V3 是一个多语言句子嵌入模型,支持超过100种语言,专注于句子相似度和特征提取任务。
文本嵌入
Transformers 支持多种语言

J
jinaai
3.7M
911
EXLMR
Apache-2.0
EXLMR是XLM-R的扩展版本,通过扩充分词器词汇表支持新语言并缓解未登录词问题,特别针对埃塞俄比亚低资源语言优化。
大型语言模型
Transformers 其他

E
Hailay
27
0
XLSR WithLM Malayalam
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在IMaSC、Indic TTS Malayalam和OpenSLR Malayalam训练集数据集上微调得到的版本,支持马拉雅拉姆语自动语音识别。
语音识别
Transformers

X
kavyamanohar
19
4
Nllb 200 Ko Gec 3.3B
支持超过100种语言和文字系统的多语言文本处理模型,涵盖多种阿拉伯语方言和少数民族语言
大型语言模型
Transformers 支持多种语言

N
sionic-ai
180
8
Llamax3 8B Alpaca
MIT
LLaMAX是一款具备强大多语言能力的语言模型,支持超100种语言的翻译,性能超越同等规模的大语言模型。
大型语言模型
Transformers

L
LLaMAX
1,488
26
SSA HuBERT Base 60k
基于HuBERT架构的自监督语音模型,专门针对撒哈拉以南非洲地区21种语言优化,训练数据达6万小时
语音识别
Transformers

S
Orange
995
11
Poro 34B Chat
Apache-2.0
Poro 34B聊天版是基于Poro 34B微调的指令跟随模型,支持芬兰语和英语双语言交互,由Silo AI、TurkuNLP小组与HPLT联合开发。
大型语言模型
Transformers 支持多种语言

P
LumiOpen
465
12
Nusabert Base
Apache-2.0
NusaBERT基础版是基于BERT架构的多语言编码器语言模型,支持13种印度尼西亚地区语言,在多个开源语料库上进行了预训练。
大型语言模型
Transformers 其他

N
LazarusNLP
68
3
Viking 33B
Apache-2.0
维京33B是一个330亿参数的纯解码器架构Transformer模型,支持芬兰语、英语及北欧多种语言处理,同时具备代码理解与生成能力。
大型语言模型
Transformers 支持多种语言

V
LumiOpen
1,030
25
Afro Xlmr Large 76L
MIT
AfroXLMR-large-76L 是通过对扩展的 XLM-R-large 模型进行 MLM(掩码语言建模)适应而创建的,覆盖了非洲广泛使用的 76 种语言,包括 4 种高资源语言。
大型语言模型 支持多种语言
A
Davlan
921
4
Viking 13B
Apache-2.0
维京13B是一个130亿参数的多语言大模型,支持芬兰语、英语及北欧诸语言,具备代码处理能力
大型语言模型
Transformers 支持多种语言

V
LumiOpen
1,233
12
Viking 7B
Apache-2.0
维京7B是一个70亿参数的Transformer模型,专注于处理芬兰语、北欧语言及编程代码,基于2万亿token训练。
大型语言模型
Transformers 支持多种语言

V
LumiOpen
2,000
42
Aya 101
Apache-2.0
Aya 101 是一个支持101种语言指令的大规模多语言生成式语言模型,在各类评估中优于同类模型。
大型语言模型
Transformers 支持多种语言

A
CohereLabs
3,468
640
Nllb Moe 54b 4bit
NLLB-MoE是Meta开发的混合专家机器翻译模型,支持200种语言,是目前最先进的开放访问机器翻译模型之一。
机器翻译
Transformers 支持多种语言

N
KnutJaegersberg
17
5
Myanmargpt
Openrail
基于GPT2架构的缅甸语语言模型,支持缅文理解和生成
大型语言模型
Transformers 其他

M
jojo-ai-mst
118
10
Gpt Sw3 20b Instruct 4bit Gptq
其他
GPT-SW3是由AI瑞典开发的大型北欧语言模型,支持5种北欧语言和英语的文本生成任务。
大型语言模型
Transformers 支持多种语言

G
AI-Sweden-Models
60
4
Madlad400 10b Mt
Apache-2.0
一个支持超过100种语言的通用语言模型,适用于多种自然语言处理任务。
大型语言模型 支持多种语言
M
google
2,412
110
Madlad400 3b Mt
Apache-2.0
一个支持超过100种语言的多语言处理模型,适用于多种自然语言处理任务。
大型语言模型 支持多种语言
M
google
7,035
119
Madlad400 8b Lm
Apache-2.0
一个支持超过200种语言的多语言处理模型,适用于多种自然语言处理任务。
大型语言模型 支持多种语言
M
jbochi
71
8
Madlad400 7b Mt
Apache-2.0
这是一个支持超过150种语言的通用模型,适用于多种自然语言处理任务。
大型语言模型 支持多种语言
M
jbochi
507
6
Wav2vec2 Phenome Based Alffaamharic
Apache-2.0
基于wav2vec2的语音识别模型,针对阿姆哈拉语进行了音素级别的微调
语音识别
Transformers

W
Samuael
34
2
Nllb Clip Large Oc
NLLB-CLIP是一个结合NLLB模型文本编码器与CLIP图像编码器的多语言视觉语言模型,支持201种语言。
文本生成图像
N
visheratin
28
2
- 1
- 2
- 3
- 4
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98