🚀 蛋白質多標籤分類模型
本項目是一個基於微調的Bert-Base-Uncased模型,主要用於多標籤分類任務。該模型能夠根據蛋白質的氨基酸序列來預測其功能,為生物學研究和蛋白質分析提供了有力支持。
🚀 快速開始
本模型的使用方式很簡單,在推理框中粘貼蛋白質序列,模型就會輸出該序列與某些GO術語相關聯的概率。
例如,輸入以下蛋白質序列:
MMSTTHLLVFLLGVVTLTTPTFGTYESPNYGKPPTPVFKPPKVKPPPYEPKPPVYEPPKKEKPEPKPPVYAPPKKEKHGPKPTMYEPPKKEKPEPKPPVYTPPKKEVPKPKPPVYEPPKKEKPEPKPPIYTPPKKEKPEPKPPVYEPPKKEKPEPKPPVYTPPKKEKPEPKPPVYEPPKKPPMYEPKPPKPPVYTPPKKEKPEPKPPMYEPPKKPPMYEPKPPKPPVYTPPKKEKPEPKPPMYQPPNNPPIYEPKPPKPPVYAPPKEEKPKPKPPVYEPPAHEPPYGHYPGHPPLGKPQ
模型將輸出如下分數:
[
[
{
"label": "GO:0000122",
"score": 0.29775485396385193
},
{
"label": "GO:0000070",
"score": 0.10477513074874878
},
{
"label": "GO:0000075",
"score": 0.08593793958425522
},
{
"label": "GO:0000118",
"score": 0.05860009789466858
},
{
"label": "GO:0000082",
"score": 0.05373986065387726
},
{
"label": "GO:0000077",
"score": 0.03928716108202934
},
{
"label": "GO:0000096",
"score": 0.03705739229917526
},
{
"label": "GO:0000079",
"score": 0.02797592058777809
},
{
"label": "GO:0000045",
"score": 0.026528609916567802
},
{
"label": "GO:0000097",
"score": 0.026119187474250793
},
{
"label": "GO:0000086",
"score": 0.019697198644280434
},
{
"label": "GO:0000049",
"score": 0.018551582470536232
},
{
"label": "GO:0000041",
"score": 0.016929756850004196
},
{
"label": "GO:0000054",
"score": 0.015105823054909706
},
{
"label": "GO:0000083",
"score": 0.01434631273150444
},
{
"label": "GO:0000105",
"score": 0.013960960321128368
},
{
"label": "GO:0000076",
"score": 0.013064960949122906
},
{
"label": "GO:0000109",
"score": 0.012523632496595383
},
{
"label": "GO:0000113",
"score": 0.012152223847806454
},
{
"label": "GO:0000062",
"score": 0.01127714291214943
},
{
"label": "GO:0000101",
"score": 0.011041304096579552
}
]
📚 詳細文檔
模型信息
這是一個經過微調的Bert-Base-Uncased模型,用於多標籤分類任務。該任務主要是基於蛋白質的氨基酸序列來預測其功能。模型以序列數據和蛋白質類別名稱作為輸入,並輸出概率分數,即該序列屬於某個類別的可能性。
屬性 |
詳情 |
模型類型 |
微調的Bert-Base-Uncased模型 |
任務類型 |
多標籤分類任務,基於蛋白質氨基酸序列預測功能 |
輸入 |
序列數據和蛋白質類名 |
輸出 |
概率分數(該序列屬於某個類別的可能性) |