P

Prot T5 Xl Uniref50

Rostlabによって開発
T5 - 3Bアーキテクチャに基づくタンパク質配列事前学習モデルで、自己教師付き学習によりタンパク質の生体物理的特性を捉えます。
ダウンロード数 78.45k
リリース時間 : 3/2/2022

モデル概要

このモデルはマスク言語モデリングの目標を用いてUniRef50データセットで事前学習され、タンパク質配列から有意義な生物学的特徴表現を抽出でき、タンパク質構造予測や機能解析などのタスクに適しています。

モデル特徴

大規模事前学習
4500万のタンパク質配列を含むUniRef50データセットで事前学習されます。
生体物理的特性の捕捉
モデルが学習した特徴は、タンパク質の三次構造を決定する重要な生体物理的特性を反映できます。
二用途設計
直接的な特徴抽出をサポートすると同時に、特定の下流タスクに対して微調整も可能です。
効率的なマスク戦略
15%のアミノ酸をランダムにマスクする戦略を採用し、そのうち90%は[MASK]に置き換え、10%はランダムなアミノ酸に置き換えます。

モデル能力

タンパク質配列特徴抽出
タンパク質二次構造予測
細胞内局在予測
膜タンパク質検出
タンパク質機能予測

使用事例

構造生物学
タンパク質二次構造予測
タンパク質の3状態または8状態の二次構造を予測します。
CASP12データセットで81%の正解率(3状態)を達成しました。
細胞生物学
細胞内局在予測
タンパク質の細胞内での局在位置を予測します。
DeepLocデータセットで81%の正解率を達成しました。
膜タンパク質検出
膜結合タンパク質と水溶性タンパク質を区別します。
DeepLocデータセットで91%の正解率を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase