X

XYZ Embedding Zh

由fangxq開發
XYZ-embedding-zh 是一個基於 sentence-transformers 的中文嵌入模型,能夠將句子和段落映射到1792維的密集向量空間,適用於聚類和語義搜索等任務。
下載量 22
發布時間 : 4/25/2025

模型概述

該模型專門為中文文本設計,能夠高效地將文本轉換為高維向量表示,支持多種自然語言處理任務,如信息檢索、重排序等。

模型特點

高維向量表示
將句子和段落映射到1792維的密集向量空間,捕捉豐富的語義信息。
多任務支持
支持多種任務,包括句子相似度計算、特徵提取、重排序和信息檢索。
中文優化
專門針對中文文本進行優化,能夠更好地處理中文語義。

模型能力

句子相似度計算
特徵提取
文本重排序
信息檢索

使用案例

信息檢索
醫療問答檢索
在醫療問答數據集中進行信息檢索,幫助用戶快速找到相關答案。
在 MTEB Cmedqa檢索 數據集上,map_at_10 達到 41.228。
電商產品檢索
在電商平臺上進行產品檢索,提升用戶搜索體驗。
在 MTEB 電商檢索 數據集上,ndcg_at_10 達到 69.719。
文本重排序
醫療問答重排序
對醫療問答結果進行重排序,提升答案的相關性。
在 MTEB CMedQAv1 數據集上,map 達到 89.618。
通用文本重排序
對通用文本檢索結果進行重排序,優化搜索結果。
在 MTEB T2重排序 數據集上,map 達到 69.066。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase