🚀 multilingual-e5-large-instruct
multilingual-e5-large-instructは、多言語対応のモデルです。このモデルは、様々な自然言語処理タスクで高い性能を発揮し、多くの言語に対応しています。
📚 ドキュメント
モデル情報
属性 |
详情 |
モデルタイプ |
多言語対応のモデル |
ベースモデル |
intfloat/multilingual-e5-large-instruct |
サポート言語 |
アフリカーンス語 (af)、アムハラ語 (am)、アラビア語 (ar)、アッサム語 (as)、アゼルバイジャン語 (az)、ベラルーシ語 (be)、ブルガリア語 (bg)、ベンガル語 (bn)、ブルトン語 (br)、ボスニア語 (bs)、カタルーニャ語 (ca)、チェコ語 (cs)、ウェールズ語 (cy)、デンマーク語 (da)、ドイツ語 (de)、ギリシャ語 (el)、英語 (en)、エスペラント語 (eo)、スペイン語 (es)、エストニア語 (et)、バスク語 (eu)、ペルシャ語 (fa)、フィンランド語 (fi)、フランス語 (fr)、フリジア語 (fy)、アイルランド語 (ga)、スコットランド・ゲール語 (gd)、ガリシア語 (gl)、グジャラート語 (gu)、ハウサ語 (ha)、ヘブライ語 (he)、ヒンディー語 (hi)、クロアチア語 (hr)、ハンガリー語 (hu)、アルメニア語 (hy)、インドネシア語 (id)、アイスランド語 (is)、イタリア語 (it)、日本語 (ja)、ジャワ語 (jv)、グルジア語 (ka)、カザフ語 (kk)、クメール語 (km)、カンナダ語 (kn)、韓国語 (ko)、クルド語 (ku)、キルギス語 (ky)、ラテン語 (la)、ラオス語 (lo)、リトアニア語 (lt)、ラトビア語 (lv)、マダガスカル語 (mg)、マケドニア語 (mk)、マラヤーラム語 (ml)、モンゴル語 (mn)、マラーティー語 (mr)、マレー語 (ms)、ミャンマー語 (my)、ネパール語 (ne)、オランダ語 (nl)、ノルウェー語 (no)、オロモ語 (om)、オリヤー語 (or)、パンジャーブ語 (pa)、ポーランド語 (pl)、パシュトゥー語 (ps)、ポルトガル語 (pt)、ルーマニア語 (ro)、ロシア語 (ru)、サンスクリット語 (sa)、シンド語 (sd)、シンハラ語 (si)、スロバキア語 (sk)、スロベニア語 (sl)、ソマリ語 (so)、アルバニア語 (sq)、セルビア語 (sr)、スンダ語 (su)、スウェーデン語 (sv)、スワヒリ語 (sw)、タミル語 (ta)、テルグ語 (te)、タイ語 (th)、タガログ語 (tl)、トルコ語 (tr)、ウイグル語 (ug)、ウクライナ語 (uk)、ウルドゥー語 (ur)、ウズベク語 (uz)、ベトナム語 (vi)、コサ語 (xh)、イディッシュ語 (yi)、中国語 (zh) |
ライセンス |
MIT |
評価結果
このモデルは、様々な自然言語処理タスクで評価されています。以下に、いくつかの代表的なタスクとその評価結果を示します。
分類タスク
- MTEB AmazonCounterfactualClassification (en)
- 正解率 (accuracy): 76.23880597014924
- 平均精度 (ap): 39.07351965022687
- F1スコア (f1): 70.04836733862683
- MTEB AmazonPolarityClassification
- 正解率 (accuracy): 96.28742500000001
- 平均精度 (ap): 94.8449918887462
- F1スコア (f1): 96.28680923610432
- MTEB Banking77Classification
- 正解率 (accuracy): 85.73376623376623
- F1スコア (f1): 85.68480707214599
検索タスク
- MTEB ArguAna
- MAP@1: 31.721
- MAP@10: 49.221
- MAP@100: 49.884
- MAP@1000: 49.888
- MRR@1: 32.432
- MRR@10: 49.5
- MRR@100: 50.163000000000004
- MRR@1000: 50.166
- MTEB CQADupstackRetrieval
- MAP@1: 27.764166666666668
- MAP@10: 37.298166666666674
- MAP@100: 38.530166666666666
- MAP@1000: 38.64416666666667
- MRR@1: 32.93558333333333
- MRR@10: 41.589749999999995
- MRR@100: 42.425333333333334
- MRR@1000: 42.476333333333336
再ランキングタスク
- MTEB AskUbuntuDupQuestions
- MAP: 63.889179122289995
- MRR: 77.61146286769556
意味的類似度タスク
- MTEB BIOSSES
- コサイン類似度のピアソン相関係数 (cos_sim_pearson): 88.15075203727929
- コサイン類似度のスピアマン相関係数 (cos_sim_spearman): 86.9622224570873
- ユークリッド距離のピアソン相関係数 (euclidean_pearson): 86.70473853624121
- ユークリッド距離のスピアマン相関係数 (euclidean_spearman): 86.9622224570873
バイテキストマイニングタスク
- MTEB BUCC (de-en)
- 正解率 (accuracy): 99.65553235908142
- F1スコア (f1): 99.60681976339595
- 精度 (precision): 99.58246346555325
- 再現率 (recall): 99.65553235908142
📄 ライセンス
このモデルはMITライセンスの下で提供されています。