xlmr-large-qa-faオープンソース質問応答システム - ペルシア語および多言語の質問応答タスクをサポート

ホーム

Xlmr Large Qa Fa

m3hrdadfiによって開発

XLM-RoBERTa大規模モデルをファインチューニングしたペルシャ語QAシステムで、PersianQAデータセットで訓練され、ペルシャ語および多言語QAタスクをサポートします。

質問応答システム

Transformers

その他#ペルシャ語QA #多言語理解 #高精度F1

ダウンロード数 65

リリース時間 : 3/2/2022

モデル概要

このモデルはペルシャ語に最適化されたQAシステムで、与えられた文脈から回答を抽出することができ、ペルシャ語および多言語環境でのQAタスクに適しています。

モデル特徴

多言語サポート

XLM-RoBERTaアーキテクチャに基づき、ペルシャ語および多言語QAタスクをサポート

高性能

PersianQAデータセットで83.46のF1値と66.88の正確一致スコアを達成

専門分野適応

ペルシャ語文化コンテンツ（ヤルダー夜などの伝統行事）に特化して最適化

モデル能力

ペルシャ語QA

多言語QA

文脈理解

回答抽出

使用事例

教育

ペルシャ文化知識QA

イランの伝統行事や文化に関する質問に回答

ヤルダー夜などの伝統行事情報を正確に識別可能

情報検索

専門技術文書QA

技術文書から特定質問の回答を抽出

ラプラス演算子などの専門質問に正確回答可能

🚀 XLM - RoBERTa large for QA (PersianQA - 🇮🇷)

このモデルは、PersianQAデータセットで[xlm - roberta - large](https://huggingface.co/xlm - roberta - large)をファインチューニングしたバージョンです。これは質問応答タスクに特化しており、ペルシャ語の質問に対して高精度な回答を提供することができます。

📦 インストール

このモデルを使用するには、transformersライブラリが必要です。以下のコマンドでインストールできます。

pip install transformers

💻 使用例

基本的な使用法

from transformers import AutoModelForQuestionAnswering, AutoTokenizer, pipeline

model_name_or_path = "m3hrdadfi/xlmr-large-qa-fa"
nlp = pipeline('question-answering', model=model_name_or_path, tokenizer=model_name_or_path)

context = """
شب یَلدا یا شب چلّه یکی از کهن‌ترین جشن‌های ایرانی است. 
در این جشن، طی شدن بلندترین شب سال و به دنبال آن بلندتر شدن طول روزها
 در نیم‌کرهٔ شمالی، که مصادف با انقلاب زمستانی است، گرامی داشته می‌شود. 
نام دیگر این شب «چِلّه» است، زیرا برگزاری این جشن، یک آیین ایرانی‌است.
"""
# Translation [EN]
# context = [
  # Yalda night or Cheleh night is one of the oldest Iranian celebrations. 
  # The festival celebrates the longest night of the year, followed by longer days in the Northern Hemisphere, 
  # which coincides with the Winter Revolution. 
  # Another name for this night is "Chelleh", because holding this celebration is an Iranian ritual.
# ]


questions = [
    "نام دیگر شب یلدا؟",
    "کهن ترین جشن ایرانی‌ها چه است؟",
    "شب یلدا مصادف با چه پدیده‌ای است؟"
]
# Translation [EN]
# questions = [
  # Another name for Yalda night?
  # What is the ancient tradition of Iranian celebration?
  # What phenomenon does Yalda night coincide with?
# ]


kwargs = {}

for question in questions:
    r = nlp(question=question, context=context, **kwargs)
    answer = " ".join([token.strip() for token in r["answer"].strip().split() if token.strip()])
    print(f"{question} {answer}")

出力

نام دیگر شب یلدا؟ «چِلّه»
کهن ترین جشن ایرانی‌ها چه است؟ شب یَلدا یا شب چلّه
شب یلدا مصادف با چه پدیده‌ای است؟ انقلاب زمستانی

# Translation [EN]
# Another name for Yalda night? Cheleh night
# What is the ancient tradition of Iranian celebration? Yalda night or Chele night
# What phenomenon does Yalda night coincide with? Winter revolution

🔧 技術詳細

ハイパーパラメータ

トレーニング中に使用されたハイパーパラメータは以下の通りです。

Property	Details
learning_rate	2e - 05
train_batch_size	8
eval_batch_size	8
seed	42
gradient_accumulation_steps	4
optimizer	Adam with betas=(0.9,0.999) and epsilon=1e - 08
lr_scheduler_type	linear
lr_scheduler_warmup_ratio	0.1
num_epochs	20.0
mixed_precision_training	Native AMP

パフォーマンス

公式の評価スクリプトを使用した評価セットでの評価結果です。

評価セット

"HasAns_exact": 58.678955453149,
"HasAns_f1": 82.3746683591845,
"HasAns_total": 651,
"NoAns_exact": 86.02150537634408,
"NoAns_f1": 86.02150537634408,
"NoAns_total": 279,
"exact": 66.88172043010752,
"f1": 83.46871946433232,
"total": 930