H

Hyenadna Small 32k Seqlen Hf

由LongSafari開發
HyenaDNA是一個長距離基因組基礎模型,在單核苷酸分辨率下預訓練了長達100萬個標記的上下文長度。
下載量 2,885
發布時間 : 11/3/2023

模型概述

HyenaDNA是一個基於Hyena操作符的長距離基因組基礎模型,能夠在單核苷酸分辨率下處理長達100萬個標記的上下文長度。它通過次二次操作實現了比傳統Transformer更高效的基因組序列建模。

模型特點

超長上下文處理
支持長達100萬個標記的上下文長度,比傳統Transformer模型長500倍
單核苷酸分辨率
使用單字符分詞器實現單核苷酸級別的精確建模
高效訓練
在1M序列長度下訓練速度比Flash Attention快160倍
全局感受野
隱式長卷積使每一層都具有全局感受野

模型能力

長序列基因組建模
調控元件預測
染色質譜分析
物種分類
上下文學習
指令微調

使用案例

基因組研究
調控元件預測
預測基因組中的調控元件位置
在23個下游任務上設定了新的SotA
物種分類
基於基因組序列進行物種分類
生物醫學研究
染色質譜分析
分析染色質結構特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase