P

Protgpt2

由nferruz開發
ProtGPT2是基於GPT2架構的蛋白質語言模型,能夠生成全新的蛋白質序列,同時保留天然蛋白質的關鍵特徵。
下載量 17.99k
發布時間 : 3/7/2022

模型概述

ProtGPT2是一個能夠理解蛋白質語言並用於全新蛋白質設計與工程的語言模型。其生成的序列在探索蛋白質空間未知區域的同時,保留了天然蛋白質的關鍵特徵(氨基酸傾向性、二級結構含量和球狀特性)。

模型特點

蛋白質序列生成
能夠生成全新的蛋白質序列,探索蛋白質空間的未知區域。
保留天然特徵
生成的序列保留了天然蛋白質的關鍵特徵,如氨基酸傾向性、二級結構含量和球狀特性。
自監督訓練
採用自監督訓練方式,通過因果建模目標訓練模型預測序列中的下一個標記。

模型能力

蛋白質序列生成
蛋白質設計
蛋白質工程

使用案例

蛋白質設計
零樣本生成全新蛋白質
從甲硫氨酸(M)開始生成全新的蛋白質序列。
生成的序列保留了天然蛋白質的關鍵特徵。
基於用戶序列微調
基於用戶提供的序列進行微調,生成特定類型的蛋白質序列。
生成的序列更符合用戶需求。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase