E

E5 Base

intfloatによって開発
E5-baseは、分類、検索、クラスタリング、意味的類似度計算など、さまざまな自然言語処理タスクに適した汎用テキスト埋め込みモデルです。
ダウンロード数 30.85k
リリース時間 : 12/26/2022

モデル概要

E5-baseは、Transformerアーキテクチャに基づくテキスト埋め込みモデルで、テキストを高次元ベクトル表現に変換し、さまざまな下流タスクに適用できます。

モデル特徴

マルチタスクサポート
分類、検索、クラスタリング、意味的類似度計算など、さまざまな自然言語処理タスクをサポートします。
高性能
MTEBデータセットなど、複数のベンチマークデータセットで優れた性能を発揮します。
汎用性
特定のタスクに合わせた大幅な調整を必要とせず、さまざまなテキスト処理シナリオに適用できます。

モデル能力

テキスト分類
テキスト検索
テキストクラスタリング
意味的類似度計算
テキスト再ランキング

使用事例

電子商取引
商品レビュー分類
Amazonの商品レビューを分類し、肯定的な評価と否定的な評価を識別します。
MTEB AmazonPolarityClassificationデータセットで87.96%の精度を達成。
商品検索
ユーザーのクエリに基づいて関連商品を検索します。
MTEB AmazonReviewsClassificationデータセットでF1スコア42.23を記録。
学術研究
論文クラスタリング
arXivおよびBioRxivの学術論文をクラスタリングします。
MTEB ArxivClusteringP2PデータセットでV-measure44.57を達成。
質問応答システム
重複質問検出
Q&Aコミュニティで重複する質問を検出します。
MTEB AskUbuntuDupQuestionsデータセットでMAP59.66を記録。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase