Jina Embeddings V3オープンソース多言語モデル - 無料でデプロイ可能、100種以上の言語の類似度計算をサポート

Jina Embeddings V3

koble-aiによって開発

Jina Embeddings V3は多言語文埋め込みモデルで、100種類以上の言語をサポートし、文の類似度計算と特徴抽出タスクに特化しています。

ダウンロード数 37

リリース時間 : 1/17/2025

モデル概要

このモデルは多言語文埋め込みモデルで、テキストを高次元ベクトル表現に変換し、文の類似度計算、情報検索、テキスト分類などのタスクに使用できます。

多言語サポート

主流言語や多くの少数民族言語を含む、100種類以上の言語の文埋め込みをサポートします。

効率的な特徴抽出

テキストを迅速に高次元ベクトル表現に変換し、後続の類似度計算と分析を容易にします。

MTEBベンチマークテスト

MTEBベンチマークテストで良好な結果を示し、さまざまなテキスト関連タスクに適しています。

文のベクトル化

多言語テキスト処理

文の類似度計算

テキスト特徴抽出

情報検索

多言語文書検索

多言語文書ライブラリ内で意味的に類似した文書を検索します。

MTEB ArguAna - PLテストで50.12%の主要スコアを達成しました。

テキスト分類

多言語テキスト分類

複数の言語のテキストを分類します。

jina-embeddings-v3 は、多言語に対応した特徴抽出や文の類似度計算などのタスクに使用できるモデルです。MTEB ベンチマークにおいて、複数のデータセットで評価され、高い性能を発揮しています。

属性	詳情
モデルタイプ	特徴抽出、文の類似度計算、MTEB ベンチマーク対応モデル
サポート言語	多言語（af, am, ar, as, az, be, bg, bn, br, bs, ca, cs, cy, da, de, el, en, eo, es, et, eu, fa, fi, fr, fy, ga, gd, gl, gu, ha, he, hi, hr, hu, hy, id, is, it, ja, jv, ka, kk, km, kn, ko, ku, ky, la, lo, lt, lv, mg, mk, ml, mn, mr, ms, my, ne, nl, no, om, or, pa, pl, ps, pt, ro, ru, sa, sd, si, sk, sl, so, sq, sr, su, sv, sw, ta, te, th, tl, tr, ug, uk, ur, uz, vi, xh, yi, zh）
推論可否	不可
ライブラリ名	transformers

タスクタイプ: STS | 指標 | 値 | |------|------| | cosine_pearson | 41.74237700998808 | | cosine_spearman | 43.4726782647566 | | euclidean_pearson | 42.244585459479964 | | euclidean_spearman | 43.525070045169606 | | main_score | 43.4726782647566 | | manhattan_pearson | 42.04616728224863 | | manhattan_spearman | 43.308828270754645 | | pearson | 41.74237700998808 | | spearman | 43.4726782647566 |

タスクタイプ: Retrieval | 指標 | 値 | |------|------| | main_score | 50.117999999999995 | | map_at_1 | 24.253 | | map_at_10 | 40.725 | | map_at_100 | 41.699999999999996 | | map_at_1000 | 41.707 | | map_at_20 | 41.467999999999996 | | map_at_3 | 35.467 | | map_at_5 | 38.291 | | mrr_at_1 | 24.751066856330013 | | mrr_at_10 | 40.91063808169072 | | mrr_at_100 | 41.885497923928675 | | mrr_at_1000 | 41.89301098419842 | | mrr_at_20 | 41.653552355442514 | | mrr_at_3 | 35.656709340919775 | | mrr_at_5 | 38.466097676623946 | | （以下、多数の指標省略） | ... |

タスクタイプ: Retrieval | 指標 | 値 | |------|------| | main_score | 34.827000000000005 | | map_at_1 | 7.049999999999999 | | map_at_10 | 14.982999999999999 | | map_at_100 | 20.816000000000003 | | map_at_1000 | 22.33 | | map_at_20 | 17.272000000000002 | | map_at_3 | 10.661 | | map_at_5 | 12.498 | | mrr_at_1 | 57.25 | | mrr_at_10 | 65.81934523809524 | | mrr_at_100 | 66.2564203928212 | | mrr_at_1000 | 66.27993662923856 | | mrr_at_20 | 66.0732139130649 | | mrr_at_3 | 64.08333333333333 | | mrr_at_5 | 65.27083333333333 | | （以下、多数の指標省略） | ... |

タスクタイプ: Retrieval | 指標 | 値 | |------|------| | main_score | 38.828 | | map_at_1 | 19.126 | | map_at_10 | 31.002000000000002 | | map_at_100 | 32.736 | | map_at_1000 | 32.933 | | map_at_20 | 31.894 | | map_at_3 | 26.583000000000002 | | map_at_5 | 28.904000000000003 | | mrr_at_1 | 37.808641975308646 | | （以下、多数の指標省略） | ... |