A

Ankh3 Xl

ElnaggarLabによって開発
Ankh3はT5アーキテクチャに基づくタンパク質言語モデルで、マスク言語モデリングと配列補完タスクを連合最適化することで事前学習され、タンパク質の特徴抽出と配列分析に適しています。
ダウンロード数 131
リリース時間 : 9/29/2024

モデル概要

Ankh3は、タンパク質配列データを処理するために特別に設計された先進的なタンパク質言語モデルです。2つの連合最適化された事前学習タスク(マスク言語モデリングと配列補完)を通じてタンパク質の深層表現を学習し、タンパク質の特徴抽出、配列分析、構造予測などのタスクに使用できます。

モデル特徴

二つのタスクの連合最適化
マスク言語モデリングと配列補完の2つのタスクを同時に最適化し、モデルのタンパク質配列に対する理解能力を強化します。
柔軟な配列処理
異なる接頭辞([NLU]/[S2S])を通じて異なるタスクを処理することをサポートし、さまざまなタンパク質分析シナリオに適応します。
大規模事前学習
UniRef50データセットに基づいて事前学習され、広範なタンパク質配列の特徴を学習します。

モデル能力

タンパク質特徴抽出
タンパク質配列補完
タンパク質配列表現学習

使用事例

タンパク質研究
タンパク質特徴抽出
タンパク質配列の深層表現を抽出し、下流の分析タスクに使用します。
意味情報を含むタンパク質配列の埋め込みを取得します。
タンパク質配列補完
既知の部分配列に基づいて完全なタンパク質配列を予測します。
入力配列と連続したタンパク質配列の補完を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase