IF I L V1.0
DeepFloyd-IF是基于像素的三级级联扩散模型,能以全新水准实现照片级真实感和语言理解。其高效性超越当前最优模型,在COCO数据集上零样本FID-30K得分达6.66。
文本生成图像
I
DeepFloyd
4,299
20
IF II L V1.0
DeepFloyd-IF是基于像素的三级级联扩散模型,能以卓越的写实性和语言理解生成图像,零样本FID-30K得分达6.66。
文本生成图像
I
DeepFloyd
33.76k
53
Roberta Base 100M 3
在1M至1B词元规模数据集上预训练的RoBERTa变体,包含BASE和MED-SMALL两种规格,适用于资源有限场景下的自然语言处理任务
大型语言模型
R
nyu-mll
18
0
Albert Base V1
Apache-2.0
ALBERT是基于Transformer架构的轻量级预训练语言模型,通过自监督学习在英语文本上训练,具有参数共享特性以减少内存占用。
大型语言模型
Transformers 英语

A
albert
18.34k
11
Albert Xlarge V2
Apache-2.0
ALBERT XLarge v2是基于Transformer架构的英语预训练模型,采用参数共享机制减少内存占用,通过掩码语言建模和句子顺序预测目标训练。
大型语言模型
Transformers 英语

A
albert
2,195
11
Roberta Base
MIT
基于Transformer架构的英语预训练模型,通过掩码语言建模目标在海量文本上训练,支持文本特征提取和下游任务微调
大型语言模型 英语
R
FacebookAI
9.3M
488
Albert Large V2
Apache-2.0
ALBERT Large v2是基于英语语料、采用掩码语言建模(MLM)目标预训练的Transformer模型,具有参数共享的特点。
大型语言模型
Transformers 英语

A
albert
6,841
19
Distilroberta Base
Apache-2.0
DistilRoBERTa是RoBERTa-base模型的蒸馏版本,参数更少但速度更快,适用于英语文本处理任务。
大型语言模型 英语
D
distilbert
1.2M
153
Albert Large V1
Apache-2.0
ALBERT是基于英语语料预训练的轻量级BERT变体,通过参数共享减少内存占用,支持掩码语言建模和句子顺序预测任务。
大型语言模型
Transformers 英语

A
albert
979
3
Albert Xxlarge V2
Apache-2.0
ALBERT XXLarge v2是基于掩码语言建模目标预训练的大型语言模型,采用参数共享的Transformer架构,具有12层重复结构和2.23亿参数。
大型语言模型 英语
A
albert
19.79k
20
Albert Xxlarge V1
Apache-2.0
ALBERT XXLarge v1是基于英语语料、采用掩码语言建模(MLM)目标预训练的Transformer模型,具有参数共享特性。
大型语言模型
Transformers 英语

A
albert
930
5
Albert Xlarge V1
Apache-2.0
ALBERT XLarge v1是基于英语语料预训练的大型语言模型,采用参数共享的轻量化Transformer架构,专注于掩码语言建模和句子顺序预测任务。
大型语言模型
Transformers 英语

A
albert
516
4
Roberta Large
MIT
基于掩码语言建模目标预训练的大型英语语言模型,采用改进的BERT训练方法
大型语言模型 英语
R
FacebookAI
19.4M
212
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98