P

Paraphrase Spanish Distilroberta

由 somosnlp-hackathon-2022 开发
基于sentence-transformers的西班牙语-英语双语模型,可将文本映射到768维向量空间,适用于语义搜索和聚类任务
下载量 17.25k
发布时间 : 3/30/2022

模型简介

该模型采用教师-学生迁移学习方法训练,能够将西班牙语句子和段落转换为蕴含语义信息的稠密向量,特别适用于跨语言或单语言的文本相似度计算任务

模型特点

双语向量表示
支持西班牙语和英语文本的联合向量编码,实现跨语言语义匹配
高效蒸馏架构
基于DistilRoBERTa的轻量级设计,在保持性能的同时提升推理效率
迁移学习优化
采用教师-学生训练范式,利用平行语料库进行知识迁移

模型能力

句子向量化
跨语言语义搜索
文本聚类分析
语义相似度计算

使用案例

信息检索
跨语言文档检索
使用统一向量空间实现西班牙语和英语文档的混合检索
文本分析
相似问题识别
在客服系统中自动识别语义相似的客户咨询
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase