H

Hyenadna Large 1m Seqlen Hf

由LongSafari開發
HyenaDNA是一個長距離基因組基礎模型,預訓練上下文長度可達100萬個標記,具有單核苷酸分辨率。
下載量 775
發布時間 : 11/3/2023

模型概述

HyenaDNA是一個專注於基因組學的基礎模型,能夠處理長達100萬個標記的序列,並實現單核苷酸級別的分析。

模型特點

長距離上下文處理
支持處理長達100萬個標記的序列,比傳統Transformer模型長500倍。
單核苷酸分辨率
使用單字符標記器實現單核苷酸級別的分析精度。
高效訓練
在100萬序列長度下訓練速度比Flash Attention快160倍。
全局感受野
隱式長卷積使每層都具有全局感受野。

模型能力

基因組序列分析
序列分類
長序列處理
單核苷酸分辨率分析

使用案例

基因組學研究
調控元件預測
預測基因組中的調控元件位置和功能。
在23個下游任務上設定了新的SotA。
染色質譜分析
分析染色質結構和功能。
物種分類
基於基因組序列進行物種分類。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase