S

Semantic Xlmr

由headlesstech開發
基於sentence-transformers的多語言句子嵌入模型,特別針對孟加拉語進行優化,適用於語義相似度計算和聚類分析
下載量 28
發布時間 : 4/5/2023

模型概述

該模型能夠將句子和段落映射到768維稠密向量空間,主要用於語義相似度計算、聚類分析和語義搜索等任務

模型特點

多語言支持
基於XLM-RoBERTa架構,支持多種語言,特別針對孟加拉語進行了優化
知識蒸餾訓練
採用paraphrase-distilroberta-base-v2作為教師模型進行知識蒸餾訓練,提高模型性能
高效語義編碼
能夠將文本轉換為768維稠密向量,保留語義信息,適合大規模語義搜索

模型能力

句子相似度計算
文本聚類分析
語義搜索
多語言文本編碼

使用案例

信息檢索
文檔檢索系統
構建基於語義的文檔檢索系統,提高搜索結果的相關性
推薦系統
內容推薦
根據用戶歷史行為和內容語義相似度進行個性化推薦
智能客服
FAQ匹配
將用戶問題與知識庫中的常見問題進行語義匹配
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase