I

Indic Sentence Similarity Sbert

l3cube-puneによって開発
これは、インドの主要な10種類の言語のSTSデータセットを使って訓練されたIndicSBERTモデルで、英語と複数のインド語に対応し、異言語間の処理能力を備えています。
ダウンロード数 1,642
リリース時間 : 3/4/2023

モデル概要

このモデルは、インドの主要な10種類の言語のSTSデータセットを使って訓練された文の類似度モデルで、英語、ヒンディー語、マラーティー語、カンナダ語、タミル語、テルグ語、グジャラート語、オリヤー語、パンジャーブ語、マラヤーラム語、ベンガル語をサポートしています。MahaNLPプロジェクトの一部として公開されています。

モデル特徴

多言語サポート
英語とインドの主要な10種類の言語の文の類似度計算をサポートします。
異言語間の処理能力
異なるインド語間で文の類似度を比較することができます。
STSデータセットを使った訓練
意味的テキスト類似度(STS)データセットを使って特別に訓練されています。

モデル能力

文の特徴抽出
文の類似度計算
異言語間の文の比較

使用事例

自然言語処理
多言語テキストのマッチング
異なるインド語で表現された類似した文を比較します。
異言語間の情報検索
異なる言語のドキュメントから類似した内容を検索します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase