2025年最佳的 59 个蛋白质模型工具

Esm2 T36 3B UR50D
MIT
ESM-2是基于掩码语言建模目标训练的新一代蛋白质模型,适用于各类以蛋白质序列为输入的下游任务微调。
蛋白质模型 Transformers
E
facebook
3.5M
22
Esm2 T6 8M UR50D
MIT
ESM-2是基于掩码语言建模目标训练的新一代蛋白质模型,适用于对蛋白质序列进行各类任务的微调。
蛋白质模型 Transformers
E
facebook
1.5M
21
Esm2 T33 650M UR50D
MIT
ESM-2是基于掩码语言建模目标训练的最先进蛋白质模型,适用于对蛋白质序列进行分析和预测任务
蛋白质模型 Transformers
E
facebook
640.23k
41
Esm2 T12 35M UR50D
MIT
ESM-2是基于掩码语言建模目标训练的前沿蛋白质模型,适用于各类蛋白质序列分析任务
蛋白质模型 Transformers
E
facebook
332.83k
15
Prot Bert
基于BERT架构的蛋白质序列预训练模型,通过自监督学习捕捉蛋白质序列的生物物理特性
蛋白质模型 Transformers
P
Rostlab
276.10k
111
Prostt5
MIT
ProstT5是一种蛋白质语言模型,能够在蛋白质序列与结构之间进行翻译。
蛋白质模型 Transformers
P
Rostlab
252.91k
23
Prot T5 Xl Uniref50
基于T5-3B架构的蛋白质序列预训练模型,通过自监督学习捕捉蛋白质的生物物理特性
蛋白质模型 Transformers
P
Rostlab
78.45k
44
Esm2 T30 150M UR50D
MIT
ESM-2是基于遮蔽语言建模目标训练的最先进蛋白质模型,适用于对各类以蛋白质序列为输入的任务进行微调。
蛋白质模型 Transformers
E
facebook
69.91k
7
Prot Bert Bfd
基于Bert架构的蛋白质序列预训练模型,通过自监督学习从21亿蛋白质序列中提取生物物理特征
蛋白质模型 Transformers
P
Rostlab
30.60k
16
Esm1b T33 650M UR50S
MIT
ESM-1b是基于Transformer的蛋白质语言模型,通过无监督学习蛋白质序列数据,可用于蛋白质结构和功能预测。
蛋白质模型 Transformers
E
facebook
24.20k
18
Rinalmo
RiNALMo是基于掩码语言建模(MLM)目标预训练的非编码RNA(ncRNA)模型,在大量非编码RNA序列上通过自监督方式训练。
蛋白质模型 其他
R
multimolecule
21.38k
2
Rna Torsionbert
其他
基于BERT架构的RNA扭转角预测模型,用于从RNA序列预测扭转角和伪扭转角
蛋白质模型 Transformers
R
sayby
20.86k
7
Esm2 T48 15B UR50D
MIT
ESM-2是基于掩码语言建模目标训练的最先进蛋白质模型,适用于对蛋白质序列进行各种任务的微调。
蛋白质模型 Transformers
E
facebook
20.80k
20
Protgpt2
Apache-2.0
ProtGPT2是基于GPT2架构的蛋白质语言模型,能够生成全新的蛋白质序列,同时保留天然蛋白质的关键特征。
蛋白质模型 Transformers
P
nferruz
17.99k
108
Helix Mrna
Helix-mRNA是一种结合状态空间和变换器架构的混合模型,专为mRNA序列分析设计
蛋白质模型 Transformers 其他
H
helical-ai
10.32k
10
Esmplusplus Large
ESM++是对ESMC的忠实实现,支持批处理操作且完全兼容Huggingface生态,无需依赖ESM官方Python包。large版本对应ESMC的6亿参数模型。
蛋白质模型 Transformers
E
Synthyra
8,314
9
DRP
MIT
DRP 是一个专注于机器人运动规划的模型,在5M检查点下训练了7k周期(约7M步数)
蛋白质模型 英语
D
jimyoung6709
7,980
1
Rnafm
基于非编码RNA数据、采用掩码语言建模(MLM)目标预训练的RNA基础模型
蛋白质模型 其他
R
multimolecule
6,791
1
Esmplusplus Small
ESM++是对ESMC的忠实实现,支持批处理且兼容标准Huggingface接口,无需依赖ESM Python包。小型版本对应ESMC的3亿参数版本。
蛋白质模型 Transformers
E
Synthyra
6,460
14
Saprot 650M AF2
MIT
SaProt是一个基于蛋白质序列和结构信息的预训练模型,特别针对低pLDDT区域进行了优化。
蛋白质模型 Transformers
S
westlake-repl
5,630
14
Protein Matryoshka Embeddings
CC
该模型为蛋白质序列生成嵌入向量,支持缩短版嵌入以加速搜索任务。
蛋白质模型 Transformers
P
monsoon-nlp
2,121
7
Distilprotbert
MIT
ProtBert-UniRef100模型的蒸馏版本,用于蛋白质特征提取和下游任务微调
蛋白质模型 Transformers
D
yarongef
1,965
9
Bert Protein Classifier
该模型基于Bert-Base-Uncased微调,用于根据蛋白质氨基酸序列预测其功能的多标签分类任务。
蛋白质模型 Transformers
B
oohtmeel
1,772
1
Generator Eukaryote 3b Base
MIT
GENERator是一个具有9.8万碱基对上下文长度和30亿参数的生成式基因组基础模型,基于真核生物DNA扩展数据集训练
蛋白质模型 Transformers
G
GenerTeam
1,599
5
Codontransformer
Apache-2.0
密码子优化的终极工具,能将蛋白质序列转化为针对目标生物体优化的DNA序列。
蛋白质模型 Transformers
C
adibvafa
1,327
7
Prot T5 Base Mt Uniref50
该模型用于预测给定氨基酸序列的蛋白质质谱数据。
蛋白质模型
P
Rostlab
671
0
Prollama Stage 1
Apache-2.0
ProLLaMA是一个基于Llama-2-7b架构的蛋白质大语言模型,专注于多任务蛋白质语言处理。
蛋白质模型 Transformers
P
GreatCaptainNemo
650
2
Prot T5 Xl Bfd
ProtT5-XL-BFD是基于蛋白质序列的自监督预训练模型,采用T5架构,在21亿蛋白质序列上训练,用于蛋白质特征提取和下游任务微调。
蛋白质模型 Transformers
P
Rostlab
605
10
Gobert
MIT
GoBERT是一款专门用于通用基因功能预测的模型,它借助基因本体图信息,能够有效捕捉基因本体(GO)功能之间的关系。
蛋白质模型 Safetensors
G
MM-YY-WW
479
1
Gpn Msa Sapiens
MIT
GPN-MSA是一个基于人类及其他89种脊椎动物训练的语言模型,专注于DNA序列分析和变异效应预测。
蛋白质模型 Transformers 其他
G
songlab
446
8
Pepmlm 650M
首个仅依赖目标蛋白序列的线性肽段结合剂从头生成器
蛋白质模型 Transformers
P
ChatterjeeLab
396
19
Prollama
Apache-2.0
ProLLaMA是基于Llama-2-7b构建的蛋白质大语言模型,专注于多任务蛋白质语言处理,能够执行蛋白质序列生成和超家族判定任务。
蛋白质模型 Transformers
P
GreatCaptainNemo
366
16
HIV V3 Bodysite
基于HIV-BERT优化的模型,用于预测HIV V3环样本的采集部位,精度较原始模型显著提升
蛋白质模型 Transformers
H
damlab
257
0
ESM2 35M Protein Molecular Function
基于进化尺度模型(ESM)的蛋白质功能预测工具,通过氨基酸序列预测蛋白质的分子功能。
蛋白质模型 Transformers
E
andrewdalpino
254
1
ESM2 150M Protein Molecular Function
基于基因本体论(GO)和ESM2架构的蛋白质分子功能预测模型
蛋白质模型 Transformers
E
andrewdalpino
175
1
Protst Esm1b
ProtST 框架通过生物医学文本增强蛋白质序列的预训练和理解,构建了 ProtDescribe 数据集,设计了三种预训练任务,支持监督学习和零样本预测。
蛋白质模型 Transformers
P
mila-intel
173
1
Isoformer
Isoformer 是一个能够准确预测差异转录本表达的模型,其性能优于现有方法,并充分利用了多模态数据。
蛋白质模型 Transformers
I
InstaDeepAI
165
3
Protgpt2 Distilled Tiny
Apache-2.0
ProtGPT2的蒸馏版本,通过知识蒸馏方法压缩为更高效的小型模型,保持性能的同时提升推理速度
蛋白质模型 Transformers
P
littleworth
157
4
Ablang Heavy
AbLang是一种抗体语言模型,专门用于处理抗体序列,特别是重链序列。该模型基于大写氨基酸字母训练,适用于蛋白质特征提取和下游任务微调。
蛋白质模型 Transformers
A
qilowoq
131
6
Ankh3 Xl
Ankh3是一个基于T5架构的蛋白质语言模型,通过联合优化掩码语言建模和序列补全任务进行预训练,适用于蛋白质特征提取和序列分析。
蛋白质模型 Transformers
A
ElnaggarLab
131
2
Nanobert
nanoBERT是一个纳米抗体特异性转换器,用于预测给定查询序列中特定位置的氨基酸。
蛋白质模型 Transformers
N
NaturalAntibody
117
4
Segment Nt Multi Species
SegmentNT-multi-species 是一种基于Nucleotide Transformer的分割模型,用于以单核苷酸分辨率预测多种基因组元素的位置。
蛋白质模型 Transformers
S
InstaDeepAI
102
1
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase