M

Micse

由sap-ai-research開發
miCSE是一個專為句子相似度計算而設計的低樣本量句子嵌入模型,通過注意力模式對齊和正則化自注意力分佈實現高效的樣本學習。
下載量 30
發布時間 : 11/9/2022

模型概述

miCSE模型通過學習強制實現不同dropout增強視角間的句法一致性,通過正則化自注意力分佈使表徵學習更具樣本效率,特別適合訓練數據有限的場景。

模型特點

低樣本量學習
通過正則化自注意力分佈實現高效的樣本學習,適合訓練數據有限的場景。
注意力模式對齊
通過強制不同數據增強視角間的注意力模式對齊進行訓練,提高模型性能。
句法一致性
學習強制實現不同dropout增強視角間的句法一致性,提升表徵質量。

模型能力

句子相似度計算
文本檢索
句子聚類

使用案例

信息檢索
文檔檢索
使用miCSE生成的句子嵌入進行相似文檔檢索。
文本分析
句子聚類
利用miCSE對句子進行嵌入後,使用聚類算法對相似句子進行分組。
如示例2所示,能夠有效區分不同情感傾向的推文。
語義相似度計算
計算兩個句子之間的餘弦相似度,評估其語義相似性。
如示例1所示,能夠準確計算句子間的相似度。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase