E

E5 All Nli Triplet Matryoshka

Omartificial-Intelligence-Spaceによって開発
これはintfloat/multilingual-e5-smallをファインチューニングしたsentence-transformersモデルで、文や段落を384次元の密なベクトル空間にマッピングし、意味的テキスト類似度や意味的検索などのタスクをサポートします。
ダウンロード数 14
リリース時間 : 7/15/2024

モデル概要

このモデルは文や段落の意味的表現を処理するために特別に設計されており、高品質な埋め込みベクトルを生成でき、様々な自然言語処理タスクに適用可能です。

モデル特徴

多言語サポート
multilingual-e5-smallモデルベースで、複数言語のテキスト処理をサポート
効率的な意味表現
テキストを384次元の密なベクトルに変換し、深層の意味情報を捕捉
MatryoshkaLossトレーニング
MatryoshkaLossとMultipleNegativesRankingLossを使用してトレーニングし、異なる次元での表現能力を最適化
高性能
複数の評価データセットで優れた性能を発揮し、スピアマンコサイン類似度は最大0.7972

モデル能力

文類似度計算
意味的検索
テキスト特徴抽出
テキスト分類
テキストクラスタリング
言い換えマイニング

使用事例

情報検索
ドキュメント検索
クエリの意味に基づいて関連ドキュメントを迅速に検索
MTEB MIRACLRetrievalHardNegatives (ar)データセットでスコア33.441
質問応答システム
ユーザーの質問と知識ベースの回答をマッチング
MTEB MLQARetrieval (ara-ara)データセットでスコア64.488
テキスト分析
意味的類似度計算
2つの文や段落の意味的類似度を比較
sts-test-384データセットでスピアマンコサイン類似度0.7972
テキストクラスタリング
意味的に類似したテキストを自動的にグループ化
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase