N

Nucleotide Transformer V2 500m Multi Species

InstaDeepAIによって開発
全ゲノムDNA配列を用いて事前学習された基礎言語モデルで、3200以上のヒトゲノムと850種類の広範な生物種のゲノム情報を統合しています。
ダウンロード数 6,166
リリース時間 : 7/27/2023

モデル概要

このモデルは5億のパラメータを持つトランスフォーマーモデルで、DNA配列解析に特化しており、分子表現型予測において高い精度の結果を提供します。

モデル特徴

多種生物種ゲノムの統合
850種類の異なる生物種のゲノムデータを統合しており、モデル生物と非モデル生物を含みます。
大規模事前学習
1740億個のヌクレオチド(約290億のトークン)で事前学習を行っています。
先進的なアーキテクチャ
回転位置埋め込みとゲート付き線形ユニットを使用した第二代Transformerアーキテクチャを採用しています。
効率的なトークナイズ
6 - マー優先のトークナイズ戦略を採用し、語彙サイズは4105です。

モデル能力

DNA配列解析
分子表現型予測
ゲノム特徴抽出
配列埋め込み生成

使用事例

ゲノミクス研究
調節エレメント予測
モデルを利用してDNA配列中の調節エレメントを予測します。
既存の方法と比較して、より正確な結果を提供します。
異種生物間比較
異なる生物種間のゲノムの類似性と相違点を分析します。
生物医学研究
疾患関連変異解析
疾患に関連するDNA配列の変異を特定します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase