P

Prot T5 Xl Bfd

由Rostlab開發
ProtT5-XL-BFD是基於蛋白質序列的自監督預訓練模型,採用T5架構,在21億蛋白質序列上訓練,用於蛋白質特徵提取和下游任務微調。
下載量 605
發布時間 : 3/2/2022

模型概述

該模型通過掩碼語言建模目標在大型蛋白質序列語料庫上進行預訓練,能夠捕捉蛋白質的生物物理特性,適用於蛋白質結構預測和功能分析。

模型特點

大規模預訓練
在包含21億蛋白質序列的BFD數據集上預訓練,覆蓋廣泛的蛋白質多樣性。
自監督學習
無需人工標註,通過掩碼語言建模目標從原始蛋白質序列中學習。
生物物理特性捕捉
模型提取的特徵能夠反映決定蛋白質形狀的重要生物物理特性。

模型能力

蛋白質序列特徵提取
蛋白質結構預測
蛋白質功能分析

使用案例

生物信息學
蛋白質二級結構預測
用於預測蛋白質的二級結構(3態或8態分類)。
在CASP12數據集上達到77%準確率(3態)
亞細胞定位預測
預測蛋白質在細胞中的定位位置。
在DeepLoc數據集上達到77%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase