S

Stella Large Zh V2

由infgrad開發
stella-large-zh-v2 是一個專注於句子相似度計算的中文模型,支持多種語義文本相似度任務和文本分類任務。
下載量 259
發布時間 : 10/13/2023

模型概述

該模型主要用於句子相似度計算、文本分類、文本聚類和重排序等任務,在多箇中文評估基準上表現出色。

模型特點

多任務評估基準支持
在多箇中文多任務評估基準(如MTEB)上表現優異,涵蓋語義文本相似度、文本分類、文本聚類和重排序等任務。
高性能句子相似度計算
在螞蟻金融問答、ATEC、銀行問答等數據集上,句子相似度計算性能突出,支持多種距離度量(餘弦相似度、歐氏距離、曼哈頓距離)。
強大的重排序能力
在CMedQAv1和CMedQAv2重排序任務中,平均準確率和平均倒數排名均超過85%,表現優異。

模型能力

句子相似度計算
文本分類
文本聚類
重排序
檢索

使用案例

金融領域
金融問答系統
用於金融領域的問答系統,計算用戶問題與候選答案的相似度。
在螞蟻金融問答數據集上,餘弦相似度皮爾遜值為47.34,斯皮爾曼值為49.94。
銀行客服問答
用於銀行客服系統中的問答匹配和相似度計算。
在銀行問答數據集上,餘弦相似度皮爾遜值為62.83,斯皮爾曼值為65.53。
醫療領域
醫療問答重排序
用於醫療問答系統中的答案重排序,提升答案的相關性。
在CMedQAv1和CMedQAv2重排序任務中,平均準確率分別為85.44和85.82。
新冠信息檢索
用於新冠相關信息的檢索和排序。
在新冠檢索任務中,首位平均準確率為68.86,前十平均準確率為77.10。
通用文本處理
文本分類
用於通用文本分類任務,如亞馬遜評論分類。
在亞馬遜評論分類(中文)任務中,準確率為40.81,F1分數為39.02。
文本聚類
用於文本聚類任務,如CLS點對點和句對句聚類。
在CLS點對點聚類任務中,V度量為39.95;在句對句聚類任務中,V度量為38.18。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase