H

Hyenadna Small 32k Seqlen Hf

LongSafariによって開発
HyenaDNAは長距離ゲノム基盤モデルで、単一塩基解像度において最大100万トークンの文脈長で事前学習されています。
ダウンロード数 2,885
リリース時間 : 11/3/2023

モデル概要

HyenaDNAはHyena演算子に基づく長距離ゲノム基盤モデルで、単一塩基解像度で最大100万トークンの文脈長を処理できます。準二次演算により、従来のTransformerよりも効率的なゲノム配列モデリングを実現しています。

モデル特徴

超長文脈処理
最大100万トークンの文脈長をサポート、従来のTransformerモデルより500倍長い
単一塩基解像度
単一文字トークナイザーを使用して塩基レベルの精密モデリングを実現
効率的な訓練
1M配列長での訓練速度がFlash Attentionより160倍高速
グローバル受容野
暗黙的な長距離畳み込みにより各層がグローバル受容野を持つ

モデル能力

長鎖ゲノムモデリング
制御要素予測
クロマチンプロファイリング
種分類
文脈学習
指示ファインチューニング

使用事例

ゲノム研究
制御要素予測
ゲノム中の制御要素位置を予測
23の下流タスクで新たなSotAを達成
種分類
ゲノム配列に基づく種分類
生物医学研究
クロマチンプロファイリング
クロマチン構造特徴を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase