A

Ankh3 Xl

Developed by ElnaggarLab
Ankh3是一個基於T5架構的蛋白質語言模型,通過聯合優化掩碼語言建模和序列補全任務進行預訓練,適用於蛋白質特徵提取和序列分析。
Downloads 131
Release Time : 9/29/2024

Model Overview

Ankh3是一個先進的蛋白質語言模型,專門設計用於處理蛋白質序列數據。它通過兩種聯合優化的預訓練任務(掩碼語言建模和序列補全)學習蛋白質的深層表示,可用於蛋白質特徵提取、序列分析和結構預測等任務。

Model Features

雙任務聯合優化
同時優化掩碼語言建模和序列補全兩個任務,增強模型對蛋白質序列的理解能力
靈活的序列處理
支持通過不同前綴([NLU]/[S2S])處理不同任務,適應多種蛋白質分析場景
大規模預訓練
基於UniRef50數據集進行預訓練,學習廣泛的蛋白質序列特徵

Model Capabilities

蛋白質特徵提取
蛋白質序列補全
蛋白質序列表示學習

Use Cases

蛋白質研究
蛋白質特徵提取
提取蛋白質序列的深層表示,用於下游分析任務
獲得包含語義信息的蛋白質序列嵌入
蛋白質序列補全
根據已知部分序列預測完整蛋白質序列
生成與輸入序列連貫的蛋白質序列補全
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase