C

Conan Embedding V1 Q4 K M GGUF

由lagoon999開發
Conan-embedding-v1是由騰訊BAC團隊開發的中文文本嵌入模型,基於sentence-transformers庫實現,適用於多種中文自然語言處理任務。
下載量 30
發布時間 : 10/29/2024

模型概述

該模型專注於中文文本的嵌入表示生成,支持語義相似度計算、文本分類、聚類、檢索和重排序等多種任務,在多箇中文基準測試中表現出色。

模型特點

多任務支持
支持多種中文NLP任務,包括語義相似度計算、文本分類、聚類、檢索和重排序等。
高性能
在多箇中文基準測試中表現優異,特別是在醫療領域相關任務上表現突出。
中文優化
專門針對中文文本進行優化,能夠更好地捕捉中文語義特徵。

模型能力

文本嵌入生成
語義相似度計算
文本分類
文本聚類
信息檢索
搜索結果重排序

使用案例

醫療領域
醫療問答檢索
用於醫療相關問題的檢索系統,幫助用戶快速找到相關醫療信息。
在CMedQA檢索任務中,map@100達到42.495
醫療文檔重排序
對醫療文檔檢索結果進行相關性重排序,提升用戶體驗。
在CMedQAv1重排序任務中,mrr達到93.358
電子商務
商品評論分類
對電商平臺的商品評論進行情感和主題分類。
在JDReview分類任務中,準確率達到90.318%
商品檢索
提升電商平臺的商品搜索相關性。
在EcomRetrieval任務中,ndcg@10達到70.991
通用NLP
語義相似度計算
計算兩段中文文本的語義相似度。
在STSB任務中,cos_sim_spearman達到81.244
文本聚類
對中文文本進行無監督聚類分析。
在CLSClusteringP2P任務中,v_measure達到60.635
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase