P

Protein Matryoshka Embeddings

monsoon-nlpによって開発
このモデルはタンパク質配列の埋め込みベクトルを生成し、検索タスクを高速化するための短縮版埋め込みをサポートします。
ダウンロード数 2,121
リリース時間 : 3/24/2024

モデル概要

Rostlab/prot_bert_bfdを基にしたタンパク質配列埋め込みモデルで、マトリョーシカ損失関数を使用してトレーニングされ、生物学分野のタンパク質類似度計算に適しています。

モデル特徴

マトリョーシカ埋め込み技術
異なる長さの埋め込みベクトルを生成可能で、タスクの要求に応じて精度と効率をバランスさせることができます
専門的なタンパク質処理
IUPAC-IUBコードのタンパク質配列に最適化されており、アミノ酸配列を直接処理します
高性能な類似度計算
UniProtデータセットで0.92以上のコサイン類似度指標を達成

モデル能力

タンパク質配列埋め込み生成
タンパク質類似度計算
生物学的配列特徴抽出

使用事例

バイオインフォマティクス
タンパク質機能予測
埋め込みベクトルの類似度を通じて未知のタンパク質の機能を推測
タンパク質構造分類
配列埋め込みに基づくタンパク質の二次/三次構造分類
TAPEベンチマークテストで良好な性能
創薬研究
ターゲットタンパク質スクリーニング
標的タンパク質と類似構造を持つ候補タンパク質を迅速にスクリーニング
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase