ModernBERT-QnA-base-squadオープンソース質問応答モデル - 抽出型質問応答タスクに効率的に対応

ホーム

Modernbert QnA Base Squad

rankyxによって開発

ModernBERTをファインチューニングした質問応答モデルで、SQuADデータセットで優れた性能を発揮し、抽出型質問応答タスクに適しています。

質問応答システム

Transformers

英語オープンソースライセンス:Apache-2.0 #抽出型質問応答 #高精度F1 #SQuAD最適化

ダウンロード数 1,106

リリース時間 : 1/8/2025

モデル概要

このモデルはanswerdotai/ModernBERT-baseをファインチューニングした質問応答システムで、SQuADデータセットに特化して最適化されており、与えられた文脈から正確に質問の答えを抽出できます。

モデル特徴

高精度質問応答

SQuADデータセットで92.59のF1スコアと86.45の正確一致率を達成

ModernBERTベース

ModernBERTアーキテクチャを採用し、より強力な言語理解能力を備えています

簡単な統合

Hugging Face Transformersパイプラインをサポートし、迅速なデプロイが可能

モデル能力

抽出型質問応答

テキスト理解

文脈分析

使用事例

教育

読解支援

学生がテキストから素早く質問の答えを見つけるのを支援

学習効率と理解力の向上

カスタマーサービス

FAQ自動回答

ナレッジベースのドキュメントから自動的に質問の答えを抽出

カスタマーサポートの作業負荷軽減

🚀 ModernBERT-QnA-base-squad

このリポジトリは、質問応答タスク用にファインチューニングされた ModernBERT モデルをホストしています。このモデルはSQuADデータセットで優れた性能を発揮し、抽出型質問応答アプリケーションに最適な選択肢となっています。

📦 インストール

現在、公式のPRがマージされるまで、特定の transformers フォークをインストールする必要があります。

> pip uninstall transformers -y
> git clone https://github.com/bakrianoo/transformers.git
> cd transformers && git checkout feat-ModernBert-QnA-Support && pip install -e .

💻 使用例

基本的な使用法

from transformers.models.modernbert.modular_modernbert import ModernBertForQuestionAnswering
from transformers import AutoTokenizer, pipeline

# モデルとトークナイザーをロード
model_id = "rankyx/ModernBERT-QnA-base-squad"
model = ModernBertForQuestionAnswering.from_pretrained(model_id)
tokenizer = AutoTokenizer.from_pretrained(model_id)

# 質問応答パイプラインを初期化
question_answerer = pipeline("question-answering", model=model, tokenizer=tokenizer)

# 入力例
question = "How many parameters does BLOOM contain?"
context = "BLOOM has 176 billion parameters and can generate text in 46 natural languages and 13 programming languages."

# 回答を取得
result = question_answerer(question=question, context=context)
print(result)

高度な使用法

# 以下の例では、短いコンテキストでの質問応答を行います。
from transformers import pipeline

model_id = "rankyx/ModernBERT-QnA-base-squad"
question_answerer = pipeline("question-answering", model=model_id)

# 入力
question = "What is the capital of France?"
context = "France's capital is Paris, known for its art, gastronomy, and culture."

# 回答を取得
result = question_answerer(question=question, context=context)
print(result)

📚 ドキュメント

モデル概要

プロパティ	詳細
モデルID	`rankyx/ModernBERT-QnA-base-squad`
ベースモデル	answerdotai/ModernBERT-base
データセット	SQuAD
評価指標	F1スコア: 92.59 完全一致率: 86.45
トレーニングフレームワーク	Hugging Face Transformers

ファインチューニングプロセス

このモデルは、質問応答用の公式スクリプトを使用して、Hugging Face Transformers ライブラリでファインチューニングされました。

ファインチューニングに使用されたコマンド

python run_qa.py \
  --model_name_or_path "answerdotai/ModernBERT-base" \
  --dataset_name squad \
  --do_train \
  --do_eval \
  --overwrite_output_dir \
  --per_device_train_batch_size 25 \
  --per_device_eval_batch_size 20 \
  --eval_strategy="steps" \
  --save_strategy="epoch" \
  --logging_steps 50 \
  --eval_steps 500 \
  --learning_rate 3e-5 \
  --warmup_ratio 0.1 \
  --weight_decay 0.01 \
  --doc_stride 128 \
  --max_seq_length 384 \
  --max_answer_length 128 \
  --num_train_epochs 2 \
  --run_name="ModernBERT-QnA-base-squad" \
  --output_dir="/path/to/output/directory"

複数のGPUを使用していて、RuntimeError: Detected that you are using FX to symbolically trace a dynamo-optimized function というエラーが発生した場合は、以下を試してください。

accelerate launch run_qa.py \
...他のパラメータ

結果

評価指標

F1スコア: 92.59
完全一致率: 86.45
トレーニング損失: 0.860

📄 ライセンス

このモデルは、Apache 2.0ライセンスの下でライセンスされています。詳細は LICENSE を参照してください。

✍️ 引用

このモデルを研究で使用する場合は、以下のように引用してください。

@misc{rankyx2024modernbertqna,
  title={ModernBERT-QnA-base-squad},
  author={Abu Bakr},
  year={2024},
  howpublished={\url{https://huggingface.co/rankyx/ModernBERT-QnA-base-squad}}
}