A

Ankh3 Xl

由ElnaggarLab開發
Ankh3是一個基於T5架構的蛋白質語言模型,通過聯合優化掩碼語言建模和序列補全任務進行預訓練,適用於蛋白質特徵提取和序列分析。
下載量 131
發布時間 : 9/29/2024

模型概述

Ankh3是一個先進的蛋白質語言模型,專門設計用於處理蛋白質序列數據。它通過兩種聯合優化的預訓練任務(掩碼語言建模和序列補全)學習蛋白質的深層表示,可用於蛋白質特徵提取、序列分析和結構預測等任務。

模型特點

雙任務聯合優化
同時優化掩碼語言建模和序列補全兩個任務,增強模型對蛋白質序列的理解能力
靈活的序列處理
支持通過不同前綴([NLU]/[S2S])處理不同任務,適應多種蛋白質分析場景
大規模預訓練
基於UniRef50數據集進行預訓練,學習廣泛的蛋白質序列特徵

模型能力

蛋白質特徵提取
蛋白質序列補全
蛋白質序列表示學習

使用案例

蛋白質研究
蛋白質特徵提取
提取蛋白質序列的深層表示,用於下游分析任務
獲得包含語義信息的蛋白質序列嵌入
蛋白質序列補全
根據已知部分序列預測完整蛋白質序列
生成與輸入序列連貫的蛋白質序列補全
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase