M

M ST5

Developed by pkshatech
m-ST5是基于mT5编码器构建的多语言句子嵌入模型,专为跨语言语义文本相似性和句子检索任务优化。
Downloads 30
Release Time : 6/26/2023

Model Overview

该模型是句子T5的多语言扩展版本,用于生成高质量的句子嵌入,支持跨语言语义文本相似性比较和句子检索。

Model Features

多语言支持
基于mT5架构,支持多种语言的句子嵌入生成。
高效微调
使用LoRA技术进行适配,实现高效参数微调。
高性能
在跨语言语义文本相似性和句子检索任务中表现优于LaBSE等基准模型。

Model Capabilities

跨语言句子嵌入生成
语义文本相似性计算
跨语言句子检索

Use Cases

跨语言信息检索
多语言文档检索
在不同语言的文档集合中查找语义相似的句子。
在BUCC任务中达到97.6的准确率
语义相似性分析
跨语言文本相似性评估
比较不同语言文本之间的语义相似度。
在XSTS任务中优于LaBSE模型
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase