Esm2 T36 3B UR50D
MIT
ESM-2是基於掩碼語言建模目標訓練的新一代蛋白質模型,適用於各類以蛋白質序列為輸入的下游任務微調。
蛋白質模型
Transformers

E
facebook
3.5M
22
Esm2 T6 8M UR50D
MIT
ESM-2是基於掩碼語言建模目標訓練的新一代蛋白質模型,適用於對蛋白質序列進行各類任務的微調。
蛋白質模型
Transformers

E
facebook
1.5M
21
Esm2 T33 650M UR50D
MIT
ESM-2是基於掩碼語言建模目標訓練的最先進蛋白質模型,適用於對蛋白質序列進行分析和預測任務
蛋白質模型
Transformers

E
facebook
640.23k
41
Esm2 T12 35M UR50D
MIT
ESM-2是基於掩碼語言建模目標訓練的前沿蛋白質模型,適用於各類蛋白質序列分析任務
蛋白質模型
Transformers

E
facebook
332.83k
15
Prot Bert
基於BERT架構的蛋白質序列預訓練模型,通過自監督學習捕捉蛋白質序列的生物物理特性
蛋白質模型
Transformers

P
Rostlab
276.10k
111
Prostt5
MIT
ProstT5是一種蛋白質語言模型,能夠在蛋白質序列與結構之間進行翻譯。
蛋白質模型
Transformers

P
Rostlab
252.91k
23
Prot T5 Xl Uniref50
基於T5-3B架構的蛋白質序列預訓練模型,通過自監督學習捕捉蛋白質的生物物理特性
蛋白質模型
Transformers

P
Rostlab
78.45k
44
Esm2 T30 150M UR50D
MIT
ESM-2是基於遮蔽語言建模目標訓練的最先進蛋白質模型,適用於對各類以蛋白質序列為輸入的任務進行微調。
蛋白質模型
Transformers

E
facebook
69.91k
7
Prot Bert Bfd
基於Bert架構的蛋白質序列預訓練模型,通過自監督學習從21億蛋白質序列中提取生物物理特徵
蛋白質模型
Transformers

P
Rostlab
30.60k
16
Esm1b T33 650M UR50S
MIT
ESM-1b是基於Transformer的蛋白質語言模型,通過無監督學習蛋白質序列數據,可用於蛋白質結構和功能預測。
蛋白質模型
Transformers

E
facebook
24.20k
18
Rinalmo
RiNALMo是基於掩碼語言建模(MLM)目標預訓練的非編碼RNA(ncRNA)模型,在大量非編碼RNA序列上通過自監督方式訓練。
蛋白質模型 其他
R
multimolecule
21.38k
2
Rna Torsionbert
其他
基於BERT架構的RNA扭轉角預測模型,用於從RNA序列預測扭轉角和偽扭轉角
蛋白質模型
Transformers

R
sayby
20.86k
7
Esm2 T48 15B UR50D
MIT
ESM-2是基於掩碼語言建模目標訓練的最先進蛋白質模型,適用於對蛋白質序列進行各種任務的微調。
蛋白質模型
Transformers

E
facebook
20.80k
20
Protgpt2
Apache-2.0
ProtGPT2是基於GPT2架構的蛋白質語言模型,能夠生成全新的蛋白質序列,同時保留天然蛋白質的關鍵特徵。
蛋白質模型
Transformers

P
nferruz
17.99k
108
Helix Mrna
Helix-mRNA是一種結合狀態空間和變換器架構的混合模型,專為mRNA序列分析設計
蛋白質模型
Transformers 其他

H
helical-ai
10.32k
10
Esmplusplus Large
ESM++是對ESMC的忠實實現,支持批處理操作且完全兼容Huggingface生態,無需依賴ESM官方Python包。large版本對應ESMC的6億參數模型。
蛋白質模型
Transformers

E
Synthyra
8,314
9
DRP
MIT
DRP 是一個專注於機器人運動規劃的模型,在5M檢查點下訓練了7k週期(約7M步數)
蛋白質模型 英語
D
jimyoung6709
7,980
1
Rnafm
基於非編碼RNA數據、採用掩碼語言建模(MLM)目標預訓練的RNA基礎模型
蛋白質模型 其他
R
multimolecule
6,791
1
Esmplusplus Small
ESM++是對ESMC的忠實實現,支持批處理且兼容標準Huggingface接口,無需依賴ESM Python包。小型版本對應ESMC的3億參數版本。
蛋白質模型
Transformers

E
Synthyra
6,460
14
Saprot 650M AF2
MIT
SaProt是一個基於蛋白質序列和結構信息的預訓練模型,特別針對低pLDDT區域進行了優化。
蛋白質模型
Transformers

S
westlake-repl
5,630
14
Protein Matryoshka Embeddings
CC
該模型為蛋白質序列生成嵌入向量,支持縮短版嵌入以加速搜索任務。
蛋白質模型
Transformers

P
monsoon-nlp
2,121
7
Distilprotbert
MIT
ProtBert-UniRef100模型的蒸餾版本,用於蛋白質特徵提取和下游任務微調
蛋白質模型
Transformers

D
yarongef
1,965
9
Bert Protein Classifier
該模型基於Bert-Base-Uncased微調,用於根據蛋白質氨基酸序列預測其功能的多標籤分類任務。
蛋白質模型
Transformers

B
oohtmeel
1,772
1
Generator Eukaryote 3b Base
MIT
GENERator是一個具有9.8萬鹼基對上下文長度和30億參數的生成式基因組基礎模型,基於真核生物DNA擴展數據集訓練
蛋白質模型
Transformers

G
GenerTeam
1,599
5
Codontransformer
Apache-2.0
密碼子優化的終極工具,能將蛋白質序列轉化為針對目標生物體優化的DNA序列。
蛋白質模型
Transformers

C
adibvafa
1,327
7
Prot T5 Base Mt Uniref50
該模型用於預測給定氨基酸序列的蛋白質質譜數據。
蛋白質模型
P
Rostlab
671
0
Prollama Stage 1
Apache-2.0
ProLLaMA是一個基於Llama-2-7b架構的蛋白質大語言模型,專注於多任務蛋白質語言處理。
蛋白質模型
Transformers

P
GreatCaptainNemo
650
2
Prot T5 Xl Bfd
ProtT5-XL-BFD是基於蛋白質序列的自監督預訓練模型,採用T5架構,在21億蛋白質序列上訓練,用於蛋白質特徵提取和下游任務微調。
蛋白質模型
Transformers

P
Rostlab
605
10
Gobert
MIT
GoBERT是一款專門用於通用基因功能預測的模型,它藉助基因本體圖信息,能夠有效捕捉基因本體(GO)功能之間的關係。
蛋白質模型
Safetensors
G
MM-YY-WW
479
1
Gpn Msa Sapiens
MIT
GPN-MSA是一個基於人類及其他89種脊椎動物訓練的語言模型,專注於DNA序列分析和變異效應預測。
蛋白質模型
Transformers 其他

G
songlab
446
8
Pepmlm 650M
首個僅依賴目標蛋白序列的線性肽段結合劑從頭生成器
蛋白質模型
Transformers

P
ChatterjeeLab
396
19
Prollama
Apache-2.0
ProLLaMA是基於Llama-2-7b構建的蛋白質大語言模型,專注於多任務蛋白質語言處理,能夠執行蛋白質序列生成和超家族判定任務。
蛋白質模型
Transformers

P
GreatCaptainNemo
366
16
HIV V3 Bodysite
基於HIV-BERT優化的模型,用於預測HIV V3環樣本的採集部位,精度較原始模型顯著提升
蛋白質模型
Transformers

H
damlab
257
0
ESM2 35M Protein Molecular Function
基於進化尺度模型(ESM)的蛋白質功能預測工具,通過氨基酸序列預測蛋白質的分子功能。
蛋白質模型
Transformers

E
andrewdalpino
254
1
ESM2 150M Protein Molecular Function
基於基因本體論(GO)和ESM2架構的蛋白質分子功能預測模型
蛋白質模型
Transformers

E
andrewdalpino
175
1
Protst Esm1b
ProtST 框架通過生物醫學文本增強蛋白質序列的預訓練和理解,構建了 ProtDescribe 數據集,設計了三種預訓練任務,支持監督學習和零樣本預測。
蛋白質模型
Transformers

P
mila-intel
173
1
Isoformer
Isoformer 是一個能夠準確預測差異轉錄本表達的模型,其性能優於現有方法,並充分利用了多模態數據。
蛋白質模型
Transformers

I
InstaDeepAI
165
3
Protgpt2 Distilled Tiny
Apache-2.0
ProtGPT2的蒸餾版本,通過知識蒸餾方法壓縮為更高效的小型模型,保持性能的同時提升推理速度
蛋白質模型
Transformers

P
littleworth
157
4
Ablang Heavy
AbLang是一種抗體語言模型,專門用於處理抗體序列,特別是重鏈序列。該模型基於大寫氨基酸字母訓練,適用於蛋白質特徵提取和下游任務微調。
蛋白質模型
Transformers

A
qilowoq
131
6
Ankh3 Xl
Ankh3是一個基於T5架構的蛋白質語言模型,通過聯合優化掩碼語言建模和序列補全任務進行預訓練,適用於蛋白質特徵提取和序列分析。
蛋白質模型
Transformers

A
ElnaggarLab
131
2
Nanobert
nanoBERT是一個納米抗體特異性轉換器,用於預測給定查詢序列中特定位置的氨基酸。
蛋白質模型
Transformers

N
NaturalAntibody
117
4
Segment Nt Multi Species
SegmentNT-multi-species 是一種基於Nucleotide Transformer的分割模型,用於以單核苷酸分辨率預測多種基因組元素的位置。
蛋白質模型
Transformers

S
InstaDeepAI
102
1
- 1
- 2