D

Dna2vec

由roychowdhuryresearch開發
基於Transformer架構的DNA序列嵌入模型,支持序列比對和基因組學應用
下載量 557
發布時間 : 2/16/2025

模型概述

DNA2Vec是一個創新的DNA序列嵌入模型,採用Transformer架構將DNA序列映射到共享向量空間,實現高效的相似性搜索與序列比對。

模型特點

無參考基因組嵌入
創新性地實現無需參考基因組的DNA序列嵌入技術
對比損失訓練
採用自監督對比損失確保序列相似性學習的魯棒性
雙版本支持
同時提供Hugging Face模型和本地訓練版本
高效向量搜索
通過DNA向量數據庫將全基因組比對轉化為局部搜索問題

模型能力

DNA序列向量化
序列相似性計算
跨物種序列比對
基因組變異檢測

使用案例

基因組學研究
序列比對
將測序讀段與參考基因組進行高效比對
高質量讀段召回率>99%
跨物種分析
分析不同物種間的DNA序列相似性
成功比對水生嗜熱菌和褐家鼠等物種序列
生物信息學工具
變異檢測
識別DNA序列中的插入缺失變異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase