P

Paraphrase Spanish Distilroberta

由somosnlp-hackathon-2022開發
基於sentence-transformers的西班牙語-英語雙語模型,可將文本映射到768維向量空間,適用於語義搜索和聚類任務
下載量 17.25k
發布時間 : 3/30/2022

模型概述

該模型採用教師-學生遷移學習方法訓練,能夠將西班牙語句子和段落轉換為蘊含語義信息的稠密向量,特別適用於跨語言或單語言的文本相似度計算任務

模型特點

雙語向量表示
支持西班牙語和英語文本的聯合向量編碼,實現跨語言語義匹配
高效蒸餾架構
基於DistilRoBERTa的輕量級設計,在保持性能的同時提升推理效率
遷移學習優化
採用教師-學生訓練範式,利用平行語料庫進行知識遷移

模型能力

句子向量化
跨語言語義搜索
文本聚類分析
語義相似度計算

使用案例

信息檢索
跨語言文檔檢索
使用統一向量空間實現西班牙語和英語文檔的混合檢索
文本分析
相似問題識別
在客服系統中自動識別語義相似的客戶諮詢
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase