S

SGPT 125M Weightedmean Nli Bitfit

由Muennighoff開發
SGPT-125M是一個基於加權平均和自然語言推理(NLI)微調的句子轉換器模型,用於句子相似度計算和特徵提取。
下載量 326
發布時間 : 3/2/2022

模型概述

該模型主要用於句子相似度計算和文本特徵提取,通過加權平均和自然語言推理微調優化了多語言文本處理能力。

模型特點

多任務評估能力
在MTEB(多任務評估基準)的多種任務上表現良好,包括分類、聚類、檢索等
多語言支持
支持多種語言的文本處理,包括英文、德文、西班牙文、法文、日文和中文
加權平均優化
採用加權平均方法優化句子表示,提高相似度計算準確性
NLI微調
通過自然語言推理(NLI)任務進行微調,增強語義理解能力

模型能力

句子相似度計算
文本特徵提取
多語言文本分類
文檔聚類
信息檢索
搜索結果重排序
語義文本相似度評估
雙語文本挖掘

使用案例

電子商務
亞馬遜評論分類
對亞馬遜多語言商品評論進行分類
英文評論分類準確率35.098%,德文24.516%,西班牙文29.098%
反事實分類
識別亞馬遜評論中的反事實陳述
英文準確率65.88%,德文59.08%,日文56.42%
學術研究
arXiv論文聚類
對arXiv學術論文進行點對點和句子對句子聚類
點對點V度量34.74,句子對句子V度量24.68
biorxiv論文聚類
對biorxiv生物學論文進行聚類分析
點對點V度量28.93,句子對句子V度量23.08
問答系統
AskUbuntu重複問題檢測
識別AskUbuntu論壇中的重複問題
平均精度52.63%,平均倒數排名65.76%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase