A

All Mpnet Base V2 Feature Extraction

由guidecare開發
基於MPNet架構的句子嵌入模型,可將文本映射到768維向量空間,適用於語義搜索和文本相似度任務
下載量 4,539
發布時間 : 6/23/2022

模型概述

這是一個句子轉換器模型,能夠將句子和段落轉換為768維的密集向量表示,支持聚類、語義搜索等自然語言處理任務。

模型特點

高精度語義編碼
在10億句對數據集上微調,能準確捕捉句子語義信息
768維稠密向量
輸出高維向量表示,適合下游機器學習任務
大規模預訓練
基於microsoft/mpnet-base模型,在超大規模數據集上微調

模型能力

文本向量化
語義相似度計算
信息檢索
文本聚類
句子級特徵提取

使用案例

信息檢索
文檔搜索
將查詢和文檔轉換為向量後計算相似度
實現基於語義而非關鍵詞的搜索
文本分析
文本聚類
對大量文本進行自動分組
發現文本集合中的主題分佈
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase