M

Multilingual Text Semantic Search Siamese BERT V1

由SeyedAli開發
基於Siamese-BERT架構的多語言文本語義搜索模型,通過2.15億(問題,答案)對訓練,生成384維歸一化嵌入向量
下載量 166
發布時間 : 9/26/2023

模型概述

該模型專為語義搜索設計,可將句子和段落映射到384維稠密向量空間,支持多語言文本的語義相似度計算

模型特點

大規模訓練數據
使用來自11個不同數據源的2.15億(問題,答案)對進行訓練
高效語義搜索
專為語義搜索場景優化,支持快速計算文本相似度
歸一化嵌入
生成歸一化的384維嵌入向量,使點積和餘弦相似度計算等效
多語言支持
雖然主要基於英語數據訓練,但能處理多語言文本語義搜索

模型能力

文本語義編碼
語義相似度計算
問答匹配
信息檢索
多語言文本處理

使用案例

信息檢索
問答系統
匹配用戶問題與知識庫中的候選答案
可準確找到與查詢語義最相關的答案
文檔搜索
根據查詢語義查找相關文檔段落
相比關鍵詞搜索能獲得更相關的結果
內容推薦
相關問題推薦
為給定問題推薦語義相似的其他問題
可提高用戶參與度和問題解決率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase