rank1 - 32bオープンソース情報検索再ランキングモデル - 推論チェーンを活用した情報関連性の高精度判断

ホーム

Rank1 32b

jhu-clspによって開発

rank1-32bはQwen2.5-32Bをベースに訓練された情報検索再ランキングモデルで、推論チェーンを生成して関連性を判断します

大規模言語モデル

Transformers

英語オープンソースライセンス:MIT #推論チェーンの再ランキング #テスト時計算 #情報検索最適化

ダウンロード数 18

リリース時間 : 2/19/2025

モデル概要

このモデルはテスト時計算方法を採用し、文書の関連性を判断する前に明示的な推論チェーンを生成することで、情報検索の精度を向上させます

モデル特徴

テスト時計算

関連性判断前に推論チェーンを生成し、意思決定の透明性を向上

論理的推論能力

複雑な関連性判断を論理的ステップに分解し、微妙なテーマをより効果的に処理

マルチサイズバリアント

5億から320億パラメータまでの異なる規模のモデルを提供

量子化サポート

AWQ量子化バージョンを提供し、展開リソース要件を低減

モデル能力

文書関連性判断

情報検索結果の再ランキング

論理的推論チェーン生成

クロスタスク検索性能

使用事例

情報検索

検索エンジン結果最適化

検索エンジンが返す上位100文書を再ランキング

関連文書のランキング位置を向上

学術文献検索

学術論文とクエリ主題の関連性を判断

研究効率を向上

🚀 rank1-32b: 情報検索における再ランキングのテスト時計算

rank1は、関連性判断を行う前に「思考」する推論型の再ランキングモデルです。この320億パラメータのモデルは、Qwen2.5-32Bベースモデルから学習され、文書がクエリに関連するかどうかを判断する前に、テスト時計算を利用して推論チェーンを生成します。

🚀 クイックスタート

rank1は、関連性判断を行う前に明示的な推論チェーンを生成することで、情報検索に新しいアプローチを導入します。従来の再ランキングモデルが直接スコアを出力するのとは異なり、rank1は以下の手順で動作します。

クエリと文書のペアを受け取ります。
<think>...</think>セクション内で推論チェーンを生成します。
二値の関連性判断（trueまたはfalse）を行います。
真偽トークンのロジットに基づいて信頼度スコアを返します。

このアプローチにより、モデルは複雑な関連性判断を論理的なステップに分解し、多様な検索タスクでのパフォーマンスを向上させます。

📄 論文 | 🚀 GitHubリポジトリ

✨ 主な機能

モデル概要

クエリと文書のペアを受け取ります。
<think>...</think>セクション内で推論チェーンを生成します。
二値の関連性判断（trueまたはfalse）を行います。
真偽トークンのロジットに基づいて信頼度スコアを返します。

このアプローチにより、モデルは複雑な関連性判断を論理的なステップに分解し、多様な検索タスクでのパフォーマンスを向上させます。

モデルファミリー

モデル	ベース	説明
rank1-0.5b	Qwen2.5-0.5B	最小のバリアント（0.5Bパラメータ）
rank1-1.5b	Qwen2.5-1.5B	小さいバリアント（1.5Bパラメータ）
rank1-3b	Qwen2.5-3B	小さいバリアント（3Bパラメータ）
rank1-7b	Qwen2.5-7B	小さいバリアント（7Bパラメータ）
rank1-14b	Qwen2.5-14B	大きいバリアント（14Bパラメータ）
rank1-32b	Qwen2.5-32B	現在のモデル（32Bパラメータ）
rank1-mistral-2501-24b	Mistral-Small 2501 24B	Mistralベースから学習
rank1-llama3-8b	Llama 3.1 8B	Llama 3.1ベースから学習

量子化バリアント

モデル	説明
rank1-7b-awq	rank1-7bの量子化バージョン
rank1-14b-awq	rank1-14bの量子化バージョン
rank1-32b-awq	rank1-32bの量子化バージョン
rank1-mistral-2501-24b-awq	rank1-mistral-24bの量子化バージョン
rank1-llama3-8b-awq	rank1-llama3-8bの量子化バージョン

リソース	説明
rank1-r1-msmarco	MS MARCOからのすべてのR1出力例
rank1-training-data	rank1モデルに使用される学習データ
rank1-run-files	上位100文書の再ランキングで使用するための事前計算された実行ファイル
GitHubリポジトリ	公式のrank1リポジトリ

💻 使用例

基本的な使用法

公式の使用方法はGitHubで確認でき、エッジケースも考慮されています。しかし、単純な使用例では、以下の最小限の例が機能します。

クリックして展開: vLLMを使用した最小限の例

from vllm import LLM, SamplingParams
import math

# Initialize the model with vLLM
model = LLM(
    model="jhu-clsp/rank1-32b",
    tensor_parallel_size=1,  # Number of GPUs
    trust_remote_code=True,
    max_model_len=16000,     # Context length
    gpu_memory_utilization=0.9,
    dtype="float16",
)

# Set up sampling parameters
sampling_params = SamplingParams(
    temperature=0,
    max_tokens=8192,
    logprobs=20,
    stop=["</think> true", "</think> false"],
    skip_special_tokens=False
)

# Prepare the prompt
def create_prompt(query, document):
    return (
        "Determine if the following passage is relevant to the query. "
        "Answer only with 'true' or 'false'.\n"
        f"Query: {query}\n"
        f"Passage: {document}\n"
        "<think>"
    )

# Example usage
query = "What are the effects of climate change?"
document = "Climate change leads to rising sea levels, extreme weather events, and disruptions to ecosystems. These effects are caused by increasing greenhouse gas concentrations in the atmosphere due to human activities."

# Generate prediction
prompt = create_prompt(query, document)
outputs = model.generate([prompt], sampling_params)

# Extract score
output = outputs[0].outputs[0]
text = output.text
final_logits = output.logprobs[-1]

# Get token IDs for "true" and "false" tokens
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("jhu-clsp/rank1-32b")
true_token = tokenizer(" true", add_special_tokens=False).input_ids[0]
false_token = tokenizer(" false", add_special_tokens=False).input_ids[0]

# Calculate relevance score (probability of "true")
true_logit = final_logits[true_token].logprob
false_logit = final_logits[false_token].logprob
true_score = math.exp(true_logit)
false_score = math.exp(false_logit)
relevance_score = true_score / (true_score + false_score)

print(f"Reasoning chain: {text}")
print(f"Relevance score: {relevance_score}")

高度な使用法

rank1は、MTEBベンチマークフレームワークと互換性があります。

from mteb import MTEB
from rank1 import rank1  # From the official repo

# Initialize the model
model = rank1(
    model_name_or_path="jhu-clsp/rank1-7b",
    num_gpus=1,
    device="cuda"
)

# Run evaluation on specific tasks
evaluation = MTEB(tasks=["NevIR"])
results = evaluation.run(model)

📚 ドキュメント

パフォーマンス

rank1-32bは、検索ベンチマークで強力なパフォーマンスを示し、特に複雑な推論を必要とするタスクで有効です。モデルが関連性判断を「考え抜く」能力は、微妙なトピックに対して特に効果的です。

具体的なベンチマーク結果と他のモデルとの比較については、論文と公式のGitHubリポジトリを参照してください。

インストール

詳細なインストール手順については、GitHubを参照してください。

引用

もしあなたが研究でrank1を使用する場合は、以下のように引用してください。

@misc{weller2025rank1testtimecomputereranking,
      title={Rank1: Test-Time Compute for Reranking in Information Retrieval}, 
      author={Orion Weller and Kathryn Ricci and Eugene Yang and Andrew Yates and Dawn Lawrie and Benjamin Van Durme},
      year={2025},
      eprint={2502.18418},
      archivePrefix={arXiv},
      primaryClass={cs.IR},
      url={https://arxiv.org/abs/2502.18418}, 
}