D

Dna2vec

由 roychowdhuryresearch 开发
基于Transformer架构的DNA序列嵌入模型,支持序列比对和基因组学应用
下载量 557
发布时间 : 2/16/2025

模型简介

DNA2Vec是一个创新的DNA序列嵌入模型,采用Transformer架构将DNA序列映射到共享向量空间,实现高效的相似性搜索与序列比对。

模型特点

无参考基因组嵌入
创新性地实现无需参考基因组的DNA序列嵌入技术
对比损失训练
采用自监督对比损失确保序列相似性学习的鲁棒性
双版本支持
同时提供Hugging Face模型和本地训练版本
高效向量搜索
通过DNA向量数据库将全基因组比对转化为局部搜索问题

模型能力

DNA序列向量化
序列相似性计算
跨物种序列比对
基因组变异检测

使用案例

基因组学研究
序列比对
将测序读段与参考基因组进行高效比对
高质量读段召回率>99%
跨物种分析
分析不同物种间的DNA序列相似性
成功比对水生嗜热菌和褐家鼠等物种序列
生物信息学工具
变异检测
识别DNA序列中的插入缺失变异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase