D

Declutr Sci Base

由johngiorgi開發
基於SciBERT的科學文本句子編碼器,通過自監督學習在200萬篇科學論文上訓練
下載量 50
發布時間 : 3/2/2022

模型概述

該模型是一個專門針對科學文本優化的句子編碼器,能夠將句子轉換為高維向量表示,用於計算句子相似度等任務。

模型特點

科學文本優化
專門針對科學文獻進行預訓練,在科學領域文本上表現優異
自監督學習
採用DeCLUTR自監督訓練策略,無需標註數據
句子級嵌入
能夠將整個句子編碼為固定長度的向量表示

模型能力

句子嵌入
語義相似度計算
科學文本特徵提取

使用案例

學術研究
文獻檢索
通過語義相似度查找相關科學文獻
提高檢索準確性和相關性
論文推薦
基於內容相似度推薦相關研究論文
文本分析
科學文本聚類
將相似的科學論文摘要分組
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase