A

All Mpnet Base Questions Clustering En

由aiknowyou開發
基於sentence-transformers的句子嵌入模型,專為問題聚類任務優化,支持英文文本的語義相似度計算
下載量 45
發布時間 : 9/13/2022

模型概述

該模型能夠將句子和段落映射到768維稠密向量空間,適用於聚類或語義搜索等任務。通過融合Quora、WikiAnswer和StackExchange三大公開數據集微調,顯著提升了識別語義相似問題的能力。

模型特點

問題聚類優化
專門針對問題聚類任務微調,在識別語義相似問題方面表現優異
多數據集融合訓練
融合Quora、WikiAnswer和StackExchange三大公開數據集進行訓練
高效語義編碼
能將句子和段落高效映射到768維稠密向量空間

模型能力

句子嵌入
語義相似度計算
問題聚類
特徵提取

使用案例

問答系統
相似問題識別
識別用戶提出的問題是否與已有問題語義相似
在WikiAnswer測試集上達到99.3%的餘弦相似度準確率
問題聚類
將語義相似的問題自動歸類
信息檢索
語義搜索
基於語義而非關鍵詞匹配的搜索系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase