D

Declutr Sci Base

Developed by johngiorgi
基于SciBERT的科学文本句子编码器,通过自监督学习在200万篇科学论文上训练
Downloads 50
Release Time : 3/2/2022

Model Overview

该模型是一个专门针对科学文本优化的句子编码器,能够将句子转换为高维向量表示,用于计算句子相似度等任务。

Model Features

科学文本优化
专门针对科学文献进行预训练,在科学领域文本上表现优异
自监督学习
采用DeCLUTR自监督训练策略,无需标注数据
句子级嵌入
能够将整个句子编码为固定长度的向量表示

Model Capabilities

句子嵌入
语义相似度计算
科学文本特征提取

Use Cases

学术研究
文献检索
通过语义相似度查找相关科学文献
提高检索准确性和相关性
论文推荐
基于内容相似度推荐相关研究论文
文本分析
科学文本聚类
将相似的科学论文摘要分组
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase