gte-multilingual-reranker-baseオープンソースモデル - 70種類以上の言語をサポートするテキスト再ランキングの強力なツール

ホーム

Gte Multilingual Reranker Base

Alibaba-NLPによって開発

GTEシリーズ初の多言語リランキングモデルで、70以上の言語をサポートし、高性能かつ長文処理能力を備えています。

テキスト埋め込み

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #多言語リランキング #長文サポート #効率的な推論

ダウンロード数 239.91k

リリース時間 : 7/20/2024

モデル概要

このモデルはGTEシリーズのリランキングモデルで、多言語検索タスク向けに設計されており、長文入力と多言語処理をサポートし、情報検索やテキストランキングタスクに適しています。

モデル特徴

高性能

多言語検索タスクやマルチタスク表現モデル評価において最先端（SOTA）のレベルを達成しています。

効率的なアーキテクチャ

エンコーダーのみのTransformerアーキテクチャを採用し、モデルサイズが小さく推論速度が速く、純粋なデコーダーLLMアーキテクチャと比べて10倍の速度向上を実現しています。

長文サポート

最大8192トークンのテキスト入力をサポートしています。

多言語能力

70以上の言語をサポートしています。

モデル能力

多言語テキストランキング

長文処理

情報検索

使用事例

情報検索

多言語ドキュメントランキング

多言語ドキュメントの関連性をランキングし、検索効果を向上させます。

多言語検索タスクでSOTA性能を達成しています。

質問応答システム

質問応答システムの候補回答をランキングし、回答品質を向上させます。

🚀 gte-multilingual-reranker-base

gte-multilingual-reranker-baseモデルは、GTEモデルファミリーの最初のリランカーモデルで、いくつかの重要な特性を持っています。

高性能：同サイズのリランカーモデルと比較して、多言語検索タスクとマルチタスク表現モデル評価において最先端（SOTA）の結果を達成します。
学習アーキテクチャ：エンコーダーのみのトランスフォーマーアーキテクチャを使用して学習されており、モデルサイズが小さくなっています。以前のデコーダーのみのLLMアーキテクチャに基づくモデル（例：gte - qwen2 - 1.5b - instruct）とは異なり、このモデルは推論に必要なハードウェア要件が低く、推論速度が10倍向上します。
長文コンテキスト：最大8192トークンのテキスト長をサポートします。
多言語対応：70以上の言語をサポートします。

📚 ドキュメント

モデル情報

Property	Details
Model Size	306M
Max Input Tokens	8192

💻 使用例

基本的な使用法

# It is recommended to install xformers and enable unpadding for acceleration,
# refer to [enable-unpadding-and-xformers](https://huggingface.co/Alibaba-NLP/new-impl#recommendation-enable-unpadding-and-acceleration-with-xformers).
# How to use it offline: [new-impl/discussions/2](https://huggingface.co/Alibaba-NLP/new-impl/discussions/2#662b08d04d8c3d0a09c88fa3)

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer

model_name_or_path = "Alibaba-NLP/gte-multilingual-reranker-base"

tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
model = AutoModelForSequenceClassification.from_pretrained(
    model_name_or_path, trust_remote_code=True,
    torch_dtype=torch.float16
)
model.eval()

pairs = [["中国的首都在哪儿","北京"], ["what is the capital of China?", "北京"], ["how to implement quick sort in python?","Introduction of quick sort"]]
with torch.no_grad():
    inputs = tokenizer(pairs, padding=True, truncation=True, return_tensors='pt', max_length=512)
    scores = model(**inputs, return_dict=True).logits.view(-1, ).float()
    print(scores)

# tensor([1.2315, 0.5923, 0.3041])

高度な使用法

# Usage with infinity:
# [Infinity](https://github.com/michaelfeil/infinity), a MIT Licensed Inference RestAPI Server.

docker run --gpus all -v $PWD/data:/app/.cache -p "7997":"7997" \
michaelf34/infinity:0.0.68 \
v2 --model-id Alibaba-NLP/gte-multilingual-reranker-base --revision "main" --dtype bfloat16 --batch-size 32 --device cuda --engine torch --port 7997

評価

複数のテキスト検索データセットに基づくリランキングの結果です。

より詳細な実験結果は論文に記載されています。

クラウドAPIサービス

オープンソースのGTEシリーズモデルに加えて、GTEシリーズモデルはアリババクラウド上で商用APIサービスとしても利用可能です。

埋め込みモデル：テキスト埋め込みモデルには3つのバージョン（text - embedding - v1/v2/v3）があり、v3が最新のAPIサービスです。
リランクモデル：gte - rerankモデルサービスが利用可能です。

商用APIの背後にあるモデルは、オープンソースモデルと完全に同一ではないことに注意してください。

引用

もし私たちの論文やモデルが役に立った場合は、以下のように引用していただけると幸いです。

@inproceedings{zhang2024mgte,
  title={mGTE: Generalized Long-Context Text Representation and Reranking Models for Multilingual Text Retrieval},
  author={Zhang, Xin and Zhang, Yanzhao and Long, Dingkun and Xie, Wen and Dai, Ziqi and Tang, Jialong and Lin, Huan and Yang, Baosong and Xie, Pengjun and Huang, Fei and others},
  booktitle={Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing: Industry Track},
  pages={1393--1412},
  year={2024}
}