Granite Embedding 107m Multilingual Onnx
G
Granite Embedding 107m Multilingual Onnx
gety-aiによって開発
IBMが開発した107Mパラメータの多言語埋め込みモデルで、12の言語をサポートし、MTEBベンチマークテストで優れた性能を発揮します。
ダウンロード数 53
リリース時間 : 2/19/2025
モデル概要
このモデルは多言語テキスト埋め込みモデルで、異なる言語のテキストを高品質なベクトル表現に変換でき、クロス言語検索や分類などのタスクに適しています。
モデル特徴
多言語サポート
12の主要言語のテキスト埋め込みをサポートし、クロス言語の意味理解を実現します。
高効率性能
107Mパラメータの軽量設計で、高品質を維持しながら推論効率を向上させます。
MTEBベンチマーク検証
複数のMTEBベンチマークテストタスクで優れた性能を発揮し、モデルの信頼性を検証しました。
モデル能力
テキストベクトル化
クロス言語意味検索
テキスト分類
意味類似度計算
使用事例
電子商取引
多言語製品レビュー分析
異なる言語のユーザーによる製品の評価を分析します。
Amazonレビュー分類タスクで36.41%の正解率を達成しました。
感情分析
ユーザーのレビューに含まれる感情傾向を識別します。
Amazon感情分類タスクで66.58%の正解率を達成しました。
情報検索
クロス言語文書検索
ある言語でのクエリを使用して、他の言語の関連文書を検索します。
AppsRetrievalタスクでNDCG@10が4.537を達成しました。
🚀 ibm-granite/granite-embedding-107m-multilingual
このモデルは、多言語の言語埋め込みを提供するtransformers
ライブラリの一部です。複数の言語に対応し、様々な自然言語処理タスクでの使用が想定されています。
📚 ドキュメント
サポート言語
- 英語 (en)
- アラビア語 (ar)
- チェコ語 (cs)
- ドイツ語 (de)
- スペイン語 (es)
- フランス語 (fr)
- イタリア語 (it)
- 日本語 (ja)
- 韓国語 (ko)
- オランダ語 (nl)
- ポルトガル語 (pt)
- 中国語 (zh)
ライセンス
このモデルはApache 2.0ライセンスの下で提供されています。
モデル情報
属性 | 详情 |
---|---|
モデルタイプ | 多言語埋め込みモデル |
ライブラリ名 | transformers |
タグ | 言語、granite、埋め込み、多言語、mteb |
評価結果
MTEB AmazonCounterfactualClassification (en-ext)
- タスクタイプ: 分類 | 指標 | 値 | |------|------| | 正解率 (accuracy) | 72.7136 | | F1スコア (f1) | 60.44540000000001 | | 重み付きF1スコア (f1_weighted) | 77.8541 | | 平均適合率 (ap) | 22.4958 | | 重み付き平均適合率 (ap_weighted) | 22.4958 | | メインスコア (main_score) | 72.7136 |
MTEB AmazonCounterfactualClassification (en)
- タスクタイプ: 分類 | 指標 | 値 | |------|------| | 正解率 (accuracy) | 71.6716 | | F1スコア (f1) | 65.4221 | | 重み付きF1スコア (f1_weighted) | 74.3533 | | 平均適合率 (ap) | 33.7567 | | 重み付き平均適合率 (ap_weighted) | 33.7567 | | メインスコア (main_score) | 71.6716 |
MTEB AmazonPolarityClassification (default)
- タスクタイプ: 分類 | 指標 | 値 | |------|------| | 正解率 (accuracy) | 66.5804 | | F1スコア (f1) | 66.2191 | | 重み付きF1スコア (f1_weighted) | 66.2191 | | 平均適合率 (ap) | 61.340799999999994 | | 重み付き平均適合率 (ap_weighted) | 61.340799999999994 | | メインスコア (main_score) | 66.5804 |
MTEB AmazonReviewsClassification (en)
- タスクタイプ: 分類 | 指標 | 値 | |------|------| | 正解率 (accuracy) | 36.412 | | F1スコア (f1) | 35.633199999999995 | | 重み付きF1スコア (f1_weighted) | 35.633199999999995 | | メインスコア (main_score) | 36.412 |
MTEB AppsRetrieval (default)
- タスクタイプ: 検索 | 指標 | 値 | |------|------| | NDCG@1 | 2.39 | | NDCG@3 | 3.527 | | NDCG@5 | 3.9759999999999995 | | NDCG@10 | 4.537 | | NDCG@20 | 5.140000000000001 | | NDCG@100 | 6.526 | | NDCG@1000 | 9.797 | | MAP@1 | 2.39 | | MAP@3 | 3.2489999999999997 | | MAP@5 | 3.499 | | MAP@10 | 3.7220000000000004 | | MAP@20 | 3.887 | | MAP@100 | 4.058 | | MAP@1000 | 4.146 | | Recall@1 | 2.39 | | Recall@3 | 4.329000000000001 | | Recall@5 | 5.418 | | Recall@10 | 7.198 | | Recall@20 | 9.588000000000001 | | Recall@100 | 17.371 | | Recall@1000 | 45.206 | | Precision@1 | 2.39 | | Precision@3 | 1.443 | | Precision@5 | 1.084 | | Precision@10 | 0.72 | | Precision@20 | 0.479 | | Precision@100 | 0.174 | | Precision@1000 | 0.045 | | MRR@1 | 2.3904 | | MRR@3 | 3.2492 | | MRR@5 | 3.4989 | | MRR@10 | 3.7220000000000004 | | MRR@20 | 3.8869000000000002 | | MRR@100 | 4.0578 | | MRR@1000 | 4.1463 | | NAUC NDCG@1 Max | 37.599700000000006 | | NAUC NDCG@1 Std | 20.302899999999998 | | NAUC NDCG@1 Diff1 | 40.4987 | | NAUC NDCG@3 Max | 31.119400000000002 | | NAUC NDCG@3 Std | 11.7335 | | NAUC NDCG@3 Diff1 | 28.788000000000004 | | NAUC NDCG@5 Max | 28.505399999999998 | | NAUC NDCG@5 Std | 12.1402 | | NAUC NDCG@5 Diff1 | 25.730900000000002 | | NAUC NDCG@10 Max | 27.0656 | | NAUC NDCG@10 Std | 12.648699999999998 | | NAUC NDCG@10 Diff1 | 22.0832 | | NAUC NDCG@20 Max | 25.953599999999998 | | NAUC NDCG@20 Std | 12.550500000000001 | | NAUC NDCG@20 Diff1 | 19.3722 | | NAUC NDCG@100 Max | 23.268 | | NAUC NDCG@100 Std | 12.8176 | | NAUC NDCG@100 Diff1 | 15.9275 | | NAUC NDCG@1000 Max | 21.921499999999998 | | NAUC NDCG@1000 Std | 12.656300000000002 | | NAUC NDCG@1000 Diff1 | 13.9004 | | NAUC MAP@1 Max | 37.599700000000006 | | NAUC MAP@1 Std | 20.302899999999998 | | NAUC MAP@1 Diff1 | 40.4987 | | NAUC MAP@3 Max | 32.2818 | | NAUC MAP@3 Std | 13.276399999999999 | | NAUC MAP@3 Diff1 | 30.9064 | | NAUC MAP@5 Max | 30.5166 | | NAUC MAP@5 Std | 13.406 | | NAUC MAP@5 Diff1 | 28.8213 | | NAUC MAP@10 Max | 29.731999999999996 | | NAUC MAP@10 Std | 13.5688 | | NAUC MAP@10 Diff1 | 26.888499999999997 | | NAUC MAP@20 Max | 29.211399999999998 | | NAUC MAP@20 Std | 13.4739 | | NAUC MAP@20 Diff1 | 25.6814 | | NAUC MAP@100 Max | 28.578300000000002 | | NAUC MAP@100 Std | 13.5385 | | NAUC MAP@100 Diff1 | 24.793100000000003 | | NAUC MAP@1000 Max | 28.3912 | | NAUC MAP@1000 Std | 13.5039 | | NAUC MAP@1000 Diff1 | 24.570600000000002 | | NAUC Recall@1 Max | 37.599700000000006 | | NAUC Recall@1 Std | 20.302899999999998 | | NAUC Recall@1 Diff1 | 40.4987 | | NAUC Recall@3 Max | 28.598000000000003 | | NAUC Recall@3 Std | 8.3847 | | NAUC Recall@3 Diff1 | 24.1871 | | NAUC Recall@5 Max | 24.5381 | | NAUC Recall@5 Std | 9.8274 | | NAUC Recall@5 Diff1 | 19.6821 | | NAUC Recall@10 Max | 22.5445 | | NAUC Recall@10 Std | 11.4415 | | NAUC Recall@10 Diff1 | 13.8268 | | NAUC Recall@20 Max | 21.3196 | | NAUC Recall@20 Std | 11.5932 | | NAUC Recall@20 Diff1 | 10.1991 | | NAUC Recall@100 Max | 16.9415 | | NAUC Recall@100 Std | 12.353200000000001 | | NAUC Recall@100 Diff1 | 5.7534 | | NAUC Recall@1000 Max | 15.9223 | | NAUC Recall@1000 Std | 12.2848 | | NAUC Recall@1000 Diff1 | 3.5477000000000003 | | NAUC Precision@1 Max | 37.599700000000006 | | NAUC Precision@1 Std | 20.302899999999998 | | NAUC Precision@1 Diff1 | 40.4987 | | NAUC Precision@3 Max | 28.598000000000003 | | NAUC Precision@3 Std | 8.3847 | | NAUC Precision@3 Diff1 | 24.1871 | | NAUC Precision@5 Max | 24.5381 | | NAUC Precision@5 Std | 9.8274 | | NAUC Precision@5 Diff1 | 19.6821 | | NAUC Precision@10 Max | 22.5445 | | NAUC Precision@10 Std | 11.4415 | | NAUC Precision@10 Diff1 | 13.8268 | | NAUC Precision@20 Max | 21.3196 | | NAUC Precision@20 Std | 11.5932 | | NAUC Precision@20 Diff1 | 10.1991 | | NAUC Precision@100 Max | 16.9415 | | NAUC Precision@100 Std | 12.353200000000001 | | NAUC Precision@100 Diff1 | 5.7534 | | NAUC Precision@1000 Max | 15.9223 | | NAUC Precision@1000 Std | 12.2848 | | NAUC Precision@1000 Diff1 | 3.5477000000000003 | | NAUC MRR@1 Max | 37.599700000000006 | | NAUC MRR@1 Std | 20.302899999999998 | | NAUC MRR@1 Diff1 | 40.4987 | | NAUC MRR@3 Max | 32.2818 | | NAUC MRR@3 Std | 13.276399999999999 | | NAUC MRR@3 Diff1 | 30.9064 | | NAUC MRR@5 Max | 30.5166 | | NAUC MRR@5 Std | 13.406 | | NAUC MRR@5 Diff1 | 28.8213 | | NAUC MRR@10 Max | 29.731999999999996 | | NAUC MRR@10 Std | 13.5688 | | NAUC MRR@10 Diff1 | 26.888499999999997 | | NAUC MRR@20 Max | 29.211399999999998 | | NAUC MRR@20 Std | 13.4739 | | NAUC MRR@20 Diff1 | 25.6814 | | NAUC MRR@100 Max | 28.578300000000002 | | NAUC MRR@100 Std | 13.5385 | | NAUC MRR@100 Diff1 | 24.793100000000003 | | NAUC MRR@1000 Max | 28.3912 | | NAUC MRR@1000 Std | 13.5039 | | NAUC MRR@1000 Diff1 | 24.570600000000002 | | メインスコア (main_score) | 4.537 |
MTEB ArguAna (default)
- タスクタイプ: 検索 | 指標 | 値 | |------|------| | NDCG@1 | 27.168999999999997 | | NDCG@3 | 41.08 | | NDCG@5 | 46.375 | | NDCG@10 | 51.663000000000004 | | NDCG@20 | 54.339999999999996 | | NDCG@100 | 55.656000000000006 | | NDCG@1000 | 55.875 | | MAP@1 | 27.168999999999997 | | MAP@3 | 37.482 | | MAP@5 | 40.416000000000004 | | MAP@10 | 42.624 | | MAP@20 | 43.376999999999995 | | MAP@100 | 43.578 | | MAP@1000 | 43.588 | | Recall@1 | 27.168999999999997 | | Recall@3 | 51.565000000000005 | | Recall@5 | 64.43799999999999 | | Recall@10 | 80.654 | | Recall@20 | 91.11 | | Recall@100 | 97.937 | | Recall@1000 | 99.57300000000001 | | Precision@1 | 27.168999999999997 | | Precision@3 | 17.188 | | Precision@5 | 12.888 | | Precision@10 | 8.065 | | Precision@20 | 4.555 | | Precision@100 | 0.979 | | Precision@1000 | 0.1 | | MRR@1 | 27.6671 | | MRR@3 | 37.6245 | | MRR@5 | 40.6188 | | MRR@10 | 42.8016 | | MRR@20 | 43.5582 | | MRR@100 | 43.7551 | | MRR@1000 | 43.765 | | NAUC NDCG@1 Max | -4.3233 | | NAUC NDCG@1 Std | -3.5458000000000003 | | NAUC NDCG@1 Diff1 | 10.8118 | | NAUC NDCG@3 Max | -1.1566 | | NAUC NDCG@3 Std | -2.5897 | | NAUC NDCG@3 Diff1 | 8.3298 | | NAUC NDCG@5 Max | -1.399 | | NAUC NDCG@5 Std | -1.9604 | | NAUC NDCG@5 Diff1 | 7.6803 | | NAUC NDCG@10 Max | 0.7746000000000001 | | NAUC NDCG@10 Std | -0.9521 | | NAUC NDCG@10 Diff1 | 9.1107 | | NAUC NDCG@20 Max | 1.0111999999999999 | | NAUC NDCG@20 Std | 0.1519 | | NAUC NDCG@20 Diff1 | 9.5802 | | NAUC NDCG@100 Max | -0.3616 | | NAUC NDCG@100 Std | -0.6704 | | NAUC NDCG@100 Diff1 | 9.2401 | | NAUC NDCG@1000 Max | -0.6766 | | NAUC NDCG@1000 Std | -1.0513 | | NAUC NDCG@1000 Diff1 | 9.0561 | | NAUC MAP@1 Max | -4.3233 | | NAUC MAP@1 Std | -3.5458000000000003 | | NAUC MAP@1 Diff1 | 10.8118 | | NAUC MAP@3 Max | -1.9845000000000002 | | NAUC MAP@3 Std | -2.6683 | | NAUC MAP@3 Diff1 | 8.7329 | | NAUC MAP@5 Max | -2.1342 | | NAUC MAP@5 Std | -2.3612 | | NAUC MAP@5 Diff1 | 8.4139 | | NAUC MAP@10 Max | -1.331 | | NAUC MAP@10 Std | -1.982 | | NAUC MAP@10 Diff1 | 9.004199999999999 | | NAUC MAP@20 Max | -1.3376000000000001 | | NAUC MAP@20 Std | -1.7424 | | NAUC MAP@20 Diff1 | 9.1012 | | NAUC MAP@100 Max | -1.5152 | | NAUC MAP@100 Std | -1.8418 | | NAUC MAP@100 Diff1 | 9.0513 | | NAUC MAP@1000 Max | -1.5264 | | NAUC MAP@1000 Std | -1.8530000000000002 | | NAUC MAP@1000 Diff1 | 9.043800000000001 | | NAUC Recall@1 Max | -4.3233 | | NAUC Recall@1 Std | -3.5458000000000003 | | NAUC Recall@1 Diff1 | 10.8118 | | NAUC Recall@3 Max | 1.2361 | | NAUC Recall@3 Std | -2.4248 | | NAUC Recall@3 Diff1 | 7.2543 | | NAUC Recall@5 Max | 0.9835999999999999 | | NAUC Recall@5 Std | -0.5726 | | NAUC Recall@5 Diff1 | 5.2376 | | NAUC Recall@10 Max | 12.7099 | | NAUC Recall@10 Std | 4.9688 | | NAUC Recall@10 Diff1 | 10.5016 | | NAUC Recall@20 Max | 28.2615 | | NAUC Recall@20 Std | 23.7662 | | NAUC Recall@20 Diff1 | 17.6392 | | NAUC Recall@100 Max | 31.295099999999998 | | NAUC Recall@100 Std | 47.1556 | | NAUC Recall@100 Diff1 | 24.055699999999998 | | NAUC Recall@1000 Max | 14.418000000000001 | | NAUC Recall@1000 Std | 56.899699999999996 | | NAUC Recall@1000 Diff1 | 3.7199999999999998 | | NAUC Precision@1 Max | -4.3233 | | NAUC Precision@1 Std | -3.5458000000000003 | | NAUC Precision@1 Diff1 | 10.8118 | | NAUC Precision@3 Max | 1.2361 | | NAUC Precision@3 Std | -2.4248 | | NAUC Precision@3 Diff1 | 7.2543 | | NAUC Precision@5 Max | 0.9835999999999999 | | NAUC Precision@5 Std | -0.5726 | | NAUC Precision@5 Diff1 | 5.2376 | | NAUC Precision@10 Max | 12.7099 | | NAUC Precision@10 Std | 4.9688 | | NAUC Precision@10 Diff1 | 10.5016 | | NAUC Precision@20 Max | 28.2615 | | NAUC Precision@20 Std | 23.7662 | | NAUC Precision@20 Diff1 | 17.6392 | | NAUC Precision@100 Max | 31.295099999999998 | | NAUC Precision@100 Std | 47.1556 | | NAUC Precision@100 Diff1 | 24.055699999999998 | | NAUC Precision@1000 Max | 14.418000000000001 | | NAUC Precision@1000 Std | 56.899699999999996 | | NAUC Precision@1000 Diff1 | 3.7199999999999998 | | NAUC MRR@1 Max | -4.2285 | | NAUC MRR@1 Std | -2.9951 | | NAUC MRR@1 Diff1 | 9.2226 | | NAUC MRR@3 Max | -2.8361 | | NAUC MRR@3 Std | -2.5372 | | NAUC MRR@3 Diff1 | 7.205 | | NAUC MRR@5 Max | -2.827 | | NAUC MRR@5 Std | -2.1469 | | NAUC MRR@5 Diff1 | 6.9564 | | NAUC MRR@10 Max | -2.0531 | | NAUC MRR@10 Std | -1.8227 | | NAUC MRR@10 Diff1 | 7.500500000000001 | | NAUC MRR@20 Max | -2.0823 | | NAUC MRR@20 Std | -1.585 | | NAUC MRR@20 Diff1 | 7.5577000000000005 | | NAUC MRR@100 Max | -2.2609 | | NAUC MRR@100 Std | -1.6787 | | NAUC MRR@100 Diff1 | 7.500500000000001 | | NAUC MRR@1000 Max | -2.2721999999999998 | | NAUC MRR@1000 Std | -1.6898 | | NAUC MRR@1000 Diff1 | 7.492400000000001 | | メインスコア (main_score) | 51.663000000000004 |
MTEB ArxivClusteringP2P (default)
- タスクタイプ: クラスタリング | 指標 | 値 | |------|------| | V-Measure | 41.4944 | | V-Measure標準偏差 | 13.6458 | | メインスコア (main_score) | 41.4944 |
MTEB ArxivClusteringS2S (default)
- タスクタイプ: クラスタリング | 指標 | 値 | |------|------| | V-Measure | 30.6155 | | V-Measure標準偏差 | 14.377999999999998 | | メインスコア (main_score) | 30.6155 |
MTEB AskUbuntuDupQuestions (default)
- タスクタイプ: 再ランキング | 指標 | 値 | |------|------| | MAP | 61.9001 | | MRR | (原文に値が記載されていません) |
📄 ライセンス
このモデルはApache 2.0ライセンスの下で提供されています。
Jina Embeddings V3
Jina Embeddings V3 は100以上の言語をサポートする多言語文埋め込みモデルで、文の類似度と特徴抽出タスクに特化しています。
テキスト埋め込み
Transformers 複数言語対応

J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
MS Marcoパッセージランキングタスクで訓練されたクロスエンコーダモデル、情報検索におけるクエリ-パッセージ関連性スコアリング用
テキスト埋め込み 英語
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
蒸留技術に基づくスパース検索モデルで、OpenSearch向けに最適化されており、推論不要のドキュメントエンコーディングをサポートし、検索関連性と効率性においてV1版を上回ります
テキスト埋め込み
Transformers 英語

O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
PubMedBERTに基づく生物医学エンティティ表現モデルで、自己アライメント事前学習により意味関係の捕捉を最適化します。
テキスト埋め込み 英語
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Largeは強力なセンテンストランスフォーマーモデルで、文の類似度とテキスト埋め込みタスクに特化しており、複数のベンチマークテストで優れた性能を発揮します。
テキスト埋め込み 英語
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 は英語の文章変換モデルで、文章類似度タスクに特化しており、複数のテキスト埋め込みベンチマークで優れた性能を発揮します。
テキスト埋め込み
Transformers 複数言語対応

G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base は50以上の言語をサポートする多言語文埋め込みモデルで、文類似度計算などのタスクに適しています。
テキスト埋め込み
Transformers 複数言語対応

G
Alibaba-NLP
1.2M
246
Polybert
polyBERTは、完全に機械駆動の超高速ポリマー情報学を実現するための化学言語モデルです。PSMILES文字列を600次元の密なフィンガープリントにマッピングし、ポリマー化学構造を数値形式で表現します。
テキスト埋め込み
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
トルコ語BERTベースの文埋め込みモデルで、意味的類似性タスクに最適化
テキスト埋め込み
Transformers その他

B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
BAAI/bge-small-en-v1.5モデルを微調整したテキスト埋め込みモデルで、MEDIデータセットとMTEB分類タスクデータセットで訓練され、検索タスクのクエリエンコーディング能力を最適化しました。
テキスト埋め込み
Safetensors 英語
G
avsolatorio
945.68k
29
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98