G

GO Language

由damlab開發
本模型旨在將蛋白質的基因本體定義編碼為向量表示,用於探索基因層面的相似性以及功能術語間的比較。
下載量 25
發布時間 : 4/8/2022

模型概述

該模型使用BERT風格的掩碼語言學習技術,訓練數據來源於模式生物的基因本體術語集合,設計用於PROT-BERT與GO-Language之間的翻譯模型,有助於預測新基因的功能。

模型特點

基因本體術語編碼
將基因本體術語及其註釋描述編碼為向量表示,便於功能比較和分析。
掩碼語言學習
採用15%掩碼率的BERT風格訓練,能夠預測缺失的基因本體術語。
跨模型翻譯
設計用於PROT-BERT與GO-Language之間的翻譯,支持新基因功能預測。

模型能力

基因本體術語預測
功能相似性分析
生物學術語向量表示

使用案例

生物信息學
新基因功能預測
通過模型預測未知基因可能參與的生物過程或分子功能。
可提供候選功能列表及置信度評分
功能相似性分析
比較不同基因的GO術語向量表示,評估功能相似性。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase