S

Scincl

由malteos開發
SciNCL是一個預訓練的BERT語言模型,用於生成研究論文的文檔級嵌入表示,利用引文圖的鄰域關係進行對比學習訓練。
下載量 6,744
發布時間 : 3/2/2022

模型概述

該模型專門用於科學文獻的嵌入表示生成,通過對比學習優化文檔級語義表示,適用於學術論文相似性計算和推薦系統。

模型特點

引文圖增強訓練
利用S2ORC引文圖的鄰域關係生成對比學習樣本,提升文檔表示質量
科學領域優化
專為科學文獻設計,在SciDocs評估基準上表現優異
雙文本編碼
支持標題與摘要的聯合編碼(通過[SEP]標記連接)

模型能力

科學文獻嵌入表示生成
文檔相似度計算
學術論文推薦

使用案例

學術研究
相關論文發現
通過嵌入相似度查找與給定論文相關的研究文獻
在SciDocs評估中引用關係任務達到93.6 map
學術推薦系統
構建基於內容的論文推薦系統
推薦任務達到54.3 ndcg
文獻分析
研究趨勢分析
通過大規模文獻嵌入聚類分析學科發展脈絡
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase