R

Rinalmo

由multimolecule開發
RiNALMo是基於掩碼語言建模(MLM)目標預訓練的非編碼RNA(ncRNA)模型,在大量非編碼RNA序列上通過自監督方式訓練。
下載量 21.38k
發布時間 : 9/10/2024

模型概述

RiNALMo是一個BERT風格的模型,專門用於處理非編碼RNA序列,通過掩碼語言建模任務進行預訓練,可用於RNA序列分析和結構預測。

模型特點

大規模預訓練
在3600萬條獨特的ncRNA序列上進行預訓練,涵蓋多個RNA數據庫。
自監督學習
通過掩碼語言建模任務進行訓練,無需人工標註數據。
序列多樣性處理
使用MMSeqs2將序列聚類,確保訓練批次中的序列多樣性。
高性能架構
採用33層Transformer架構,隱藏層大小1280,20個頭,適合處理長序列。

模型能力

RNA序列分析
RNA結構預測
掩碼核苷酸預測
RNA序列特徵提取

使用案例

生物信息學
HIV-1 RNA分析
預測HIV-1 RNA序列中的掩碼核苷酸
模型能準確預測掩碼位置最可能的核苷酸
microRNA分析
預測microRNA-21序列中的掩碼核苷酸
模型能識別microRNA序列中的關鍵核苷酸
RNA研究
非編碼RNA功能預測
通過序列特徵預測非編碼RNA的功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase