S

Stackoverflow Mpnet Base

由flax-sentence-embeddings開發
基於微軟mpnet-base模型在StackOverflow數據上訓練的句子嵌入模型,適用於語義搜索和句子相似度計算
下載量 35
發布時間 : 3/2/2022

模型概述

這是一個基於微軟mpnet-base模型在18,562,443組StackOverflow(標題,正文)配對數據上訓練得到的句子嵌入模型,可用於生成捕獲語義信息的向量表示

模型特點

大規模StackOverflow數據訓練
使用18,562,443組StackOverflow(標題,正文)配對數據進行訓練,針對技術問答場景優化
高效TPU訓練
在7個TPU v3-8加速器上訓練,獲得Google技術團隊支持
對比學習優化
採用連體網絡架構和對比學習目標進行訓練,優化句子嵌入質量

模型能力

句子嵌入生成
語義相似度計算
文本特徵提取
語義搜索
文本聚類

使用案例

技術問答系統
StackOverflow問題匹配
匹配用戶提問與已有問題的相似度
提高問題檢索準確率
技術文檔檢索
根據用戶查詢檢索相關技術文檔
提升文檔搜索效率
信息檢索
語義搜索
基於語義而非關鍵詞匹配的搜索系統
提供更相關的搜索結果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase