I

Indic Sentence Similarity Sbert

由l3cube-pune開發
這是一個基於印度十種主要語言的STS數據集訓練的IndicSBERT模型,適用於英語和多種印度語言,具備跨語言能力。
下載量 1,642
發布時間 : 3/4/2023

模型概述

該模型是基於印度十種主要語言的STS數據集訓練的句子相似度模型,支持英語、印地語、馬拉地語、卡納達語、泰米爾語、泰盧固語、古吉拉特語、奧里亞語、旁遮普語、馬拉雅拉姆語和孟加拉語。作為MahaNLP項目的一部分發布。

模型特點

多語言支持
支持英語和印度十種主要語言的句子相似度計算
跨語言能力
能夠在不同印度語言之間進行句子相似度比較
基於STS數據集訓練
使用語義文本相似度(STS)數據集進行專門訓練

模型能力

句子特徵提取
句子相似度計算
跨語言句子比較

使用案例

自然語言處理
多語言文本匹配
比較不同印度語言表達的相似句子
跨語言信息檢索
在不同語言的文檔中查找相似內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase