P

Prot Bert

由Rostlab開發
基於BERT架構的蛋白質序列預訓練模型,通過自監督學習捕捉蛋白質序列的生物物理特性
下載量 276.10k
發布時間 : 3/2/2022

模型概述

ProtBert是基於蛋白質序列使用掩碼語言建模(MLM)目標進行預訓練的模型,能夠提取蛋白質特徵或用於下游任務微調,學習蛋白質序列中的生物物理特性

模型特點

蛋白質專用預訓練
專門針對蛋白質序列優化,將每條序列視為獨立文檔處理
生物物理特性捕捉
模型嵌入能夠反映決定蛋白質空間構象的重要特性
大規模訓練數據
在Uniref100的2.17億條蛋白質序列上預訓練

模型能力

蛋白質序列特徵提取
蛋白質序列掩碼預測
蛋白質結構相關任務微調

使用案例

蛋白質結構預測
二級結構預測
預測蛋白質的3態或8態二級結構
在CASP12上達到75%準確率(3態)
蛋白質功能分析
亞細胞定位預測
預測蛋白質在細胞中的定位位置
在DeepLoc數據集上達到79%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase