P

Protst Esm1b

由mila-intel開發
ProtST 框架通過生物醫學文本增強蛋白質序列的預訓練和理解,構建了 ProtDescribe 數據集,設計了三種預訓練任務,支持監督學習和零樣本預測。
下載量 173
發布時間 : 1/2/2024

模型概述

ProtST 是一個結合生物醫學文本和蛋白質序列的預訓練框架,旨在增強蛋白質語言模型的功能理解和表示能力。

模型特點

多模態預訓練
結合蛋白質序列和生物醫學文本進行預訓練,增強模型對蛋白質功能的理解。
零樣本預測
支持零樣本分類任務,無需額外訓練即可進行蛋白質功能預測。
高性能表示學習
在多種表示學習基準上優於現有模型,尤其在功能預測任務中表現突出。

模型能力

蛋白質序列表示學習
蛋白質功能預測
零樣本分類
多模態對齊

使用案例

生物醫學研究
蛋白質亞細胞定位預測
預測蛋白質在細胞中的定位,如細胞核、線粒體等。
在零樣本任務中表現出優越性能。
蛋白質功能註釋
自動為蛋白質序列添加功能描述。
通過多模態對齊提高註釋準確性。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase