D

Diffcse Bert Base Uncased Trans

由voidism開發
DiffCSE是一種無監督對比學習框架,用於學習對句子差異敏感的句子嵌入。
下載量 14
發布時間 : 4/14/2022

模型概述

DiffCSE通過學習原始句子和編輯後句子之間的差異來生成句子嵌入,其中編輯後的句子是通過隨機掩碼原始句子並從掩碼語言模型中採樣得到的。該方法在語義文本相似性任務上表現優異。

模型特點

差異敏感的句子嵌入
通過學習原始句子和編輯後句子之間的差異來生成更具表達力的句子嵌入
無監督對比學習
不需要標註數據即可訓練,利用自監督學習目標
等變對比學習
對某些類型的增強不敏感而對其他'有害'類型的增強敏感

模型能力

句子嵌入生成
語義相似度計算
文本表示學習

使用案例

自然語言處理
語義文本相似性
計算兩個句子之間的語義相似度
在STS任務上比無監督SimCSE高出2.3個絕對點
信息檢索
基於語義相似度的文檔檢索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase