T

Text2vec Base Multilingual

shibing624によって開発
多言語対応の文埋め込みモデルで、中国語、英語、ドイツ語、フランス語など複数の言語をサポートし、文の類似度計算と特徴抽出タスクに特化しています。
ダウンロード数 128.13k
リリース時間 : 6/22/2023

モデル概要

このモデルはSentence-Transformersフレームワークを基にしており、多言語自然言語推論データセットで訓練されており、テキストを高品質なベクトル表現に変換でき、クロスランゲージの意味的類似度計算や情報検索などのタスクに適しています。

モデル特徴

多言語サポート
中国語、英語、ドイツ語、フランス語など複数言語のテキスト埋め込みをサポート
高性能な文類似度計算
複数のベンチマークテストで優れた性能を発揮し、文間の意味的類似度を正確に計算可能
事前訓練済みモデル
大規模多言語データセットで事前訓練されており、すぐに使用可能

モデル能力

文類似度計算
テキスト特徴抽出
クロスランゲージセマンティック検索
テキスト分類
クラスタリング分析

使用事例

情報検索
クロスランゲージドキュメント検索
統一されたベクトル空間を使用して異なる言語のドキュメントの類似度検索を実現
テキスト分類
多言語感情分析
文埋め込みに基づいて多言語テキストの感情分類を実現
MTEB EmotionClassificationで43.35%の精度を達成
クラスタリング分析
学術論文クラスタリング
arXiv論文を主題ごとにクラスタリング
MTEB ArxivClusteringP2Pで32.32 v_measureスコアを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase