P

Prot Bert Bfd

由Rostlab開發
基於Bert架構的蛋白質序列預訓練模型,通過自監督學習從21億蛋白質序列中提取生物物理特徵
下載量 30.60k
發布時間 : 3/2/2022

模型概述

該模型採用掩碼語言建模目標在海量蛋白質序列上預訓練,可捕捉決定蛋白質形態的關鍵生物物理特性,支持蛋白質特徵提取和下游任務微調

模型特點

大規模預訓練
在包含21億蛋白質序列的BFD數據集上預訓練,學習蛋白質序列的深層表示
生物物理特性捕捉
模型嵌入能夠自動捕捉決定蛋白質形態的關鍵生物物理特性
雙重序列處理
支持512和2048兩種序列長度處理模式,適應不同規模蛋白質分析需求

模型能力

蛋白質序列特徵提取
蛋白質掩碼氨基酸預測
蛋白質下游任務微調

使用案例

蛋白質結構預測
二級結構預測
預測蛋白質的3態或8態二級結構
在CASP12數據集上達到76%準確率(3態)
蛋白質功能分析
亞細胞定位預測
預測蛋白質在細胞內的定位位置
DeepLoc數據集上達到78%準確率
膜蛋白識別
識別蛋白質是否屬於膜蛋白
DeepLoc數據集上達到91%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase