P

Prot Bert

Rostlabによって開発
BERTアーキテクチャに基づくタンパク質配列事前学習モデルで、自己教師付き学習によりタンパク質配列の生物物理学的特性を捉えます。
ダウンロード数 276.10k
リリース時間 : 3/2/2022

モデル概要

ProtBertは、マスク言語モデリング(MLM)の目標を使用してタンパク質配列に基づいて事前学習されたモデルで、タンパク質の特徴を抽出したり、下流のタスクの微調整に使用したりでき、タンパク質配列の生物物理学的特性を学習します。

モデル特徴

タンパク質専用事前学習
タンパク質配列に特化して最適化され、各配列を独立したドキュメントとして処理します。
生物物理学的特性の捕捉
モデルの埋め込みは、タンパク質の立体構造を決定する重要な特性を反映できます。
大規模学習データ
Uniref100の2.17億のタンパク質配列で事前学習されます。

モデル能力

タンパク質配列特徴抽出
タンパク質配列マスク予測
タンパク質構造関連タスクの微調整

使用事例

タンパク質構造予測
二次構造予測
タンパク質の3状態または8状態の二次構造を予測します。
CASP12で75%の精度(3状態)に達します。
タンパク質機能分析
細胞内局在予測
タンパク質の細胞内での局在位置を予測します。
DeepLocデータセットで79%の精度に達します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase