X

Xiaobu Embedding

由lier007開發
xiaobu-embedding是一個多任務嵌入模型,支持多種中文自然語言處理任務,包括文本相似度計算、分類、聚類和檢索等。
下載量 147
發布時間 : 1/9/2024

模型概述

該模型專注於中文文本的嵌入表示學習,能夠生成高質量的文本向量,適用於多種下游任務,如語義相似度計算、文本分類和信息檢索等。

模型特點

多任務支持
支持多種自然語言處理任務,包括文本相似度計算、分類、聚類和檢索等。
中文優化
專門針對中文文本進行優化,能夠更好地捕捉中文語義特徵。
高性能
在多箇中文基準測試中表現出色,特別是在醫療領域相關任務上表現優異。

模型能力

文本嵌入
語義相似度計算
文本分類
文本聚類
信息檢索
重排序

使用案例

醫療領域
醫療問答檢索
用於醫療相關問題的檢索和回答
在CMedQA檢索任務上MAP@10達到37.604
醫療文檔重排序
對醫療相關文檔進行相關性重排序
在CMedQAv2重排序任務上MAP達到87.57
電子商務
商品評論分類
對商品評論進行情感和主題分類
在京東評論分類任務上準確率達到86.74%
商品檢索
電子商務平臺中的商品搜索功能
在EcomRetrieval任務上MAP@10達到63.14
通用NLP
文本相似度計算
計算兩段文本的語義相似度
在STSB任務上餘弦相似度皮爾遜達到79.75
文本分類
對文本進行多類別分類
在IFlyTek分類任務上準確率達到49.74%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase