E5 Base Multilingual 4096
E5-base-multilingual-4096はintfloat/multilingual-e5-baseのローカルスパースグローバルバージョンで、最大4096トークンの多言語テキスト埋め込みモデルを処理できます。
ダウンロード数 340
リリース時間 : 6/15/2023
モデル概要
このモデルは多言語テキスト埋め込みモデルで、文の類似度タスクに特化しており、複数の言語のテキストを処理し高品質な埋め込みベクトルを生成できます。
モデル特徴
多言語サポート
100以上の言語のテキスト埋め込みをサポートし、主要な世界言語や多くの少数言語を含みます。
長文処理
最大4096トークンの長文を処理でき、長いドキュメントや段落の処理に適しています。
高品質埋め込み
弱教師付きコントラスティブ事前学習手法に基づき、高品質なテキスト埋め込みベクトルを生成します。
モデル能力
多言語テキスト埋め込み
文の類似度計算
クロスランゲージ情報検索
使用事例
情報検索
クロスランゲージドキュメント検索
このモデルを使用して、異なる言語だが内容が類似したドキュメントを検索できます。
クロスランゲージ検索の精度と効率を向上
質問応答システム
多言語質問応答
複数の言語をサポートする質問応答システムを構築し、異なる言語のクエリを理解して関連する回答を返します。
質問応答システムの言語カバレッジを拡大
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98