P

Prot Bert Bfd

Rostlabによって開発
Bertアーキテクチャに基づくタンパク質配列の事前学習モデルで、自己教師付き学習により21億のタンパク質配列から生物物理学的特徴を抽出します。
ダウンロード数 30.60k
リリース時間 : 3/2/2022

モデル概要

このモデルはマスク言語モデリングの目標を用いて大量のタンパク質配列で事前学習され、タンパク質の形態を決定する重要な生物物理学的特性を捉えることができ、タンパク質の特徴抽出と下流タスクの微調整をサポートします。

モデル特徴

大規模事前学習
21億のタンパク質配列を含むBFDデータセットで事前学習され、タンパク質配列の深層表現を学習します。
生物物理学的特性の捕捉
モデルの埋め込みは、タンパク質の形態を決定する重要な生物物理学的特性を自動的に捉えることができます。
二重配列処理
512と2048の2種類の配列長の処理モードをサポートし、異なる規模のタンパク質分析のニーズに対応します。

モデル能力

タンパク質配列特徴抽出
タンパク質のマスクアミノ酸予測
タンパク質の下流タスクの微調整

使用事例

タンパク質構造予測
二次構造予測
タンパク質の3状態または8状態の二次構造を予測します。
CASP12データセットで76%の正解率(3状態)を達成しました。
タンパク質機能分析
細胞内局在予測
タンパク質の細胞内での局在位置を予測します。
DeepLocデータセットで78%の正解率を達成しました。
膜タンパク質識別
タンパク質が膜タンパク質に属するかどうかを識別します。
DeepLocデータセットで91%の正解率を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase