xlmr-large-qa-fa開源問答系統 - 支持波斯語及多語言問答任務

首頁

Xlmr Large Qa Fa

由m3hrdadfi開發

基於XLM-RoBERTa大模型微調的波斯語問答系統，在PersianQA數據集上訓練，支持波斯語和多語言問答任務。

問答系統

Transformers

其他#波斯語問答 #多語言理解 #高精度F1

下載量 65

發布時間 : 3/2/2022

模型概述

該模型是一個針對波斯語優化的問答系統，能夠從給定上下文中提取答案，適用於波斯語和多語言環境下的問答任務。

模型特點

多語言支持

基於XLM-RoBERTa架構，支持波斯語和多語言問答任務

高性能

在PersianQA數據集上達到83.46的F1值和66.88的精確匹配分數

專業領域適應

針對波斯語文化內容（如雅爾達夜等傳統節日）有專門優化

模型能力

波斯語問答

多語言問答

上下文理解

答案提取

使用案例

教育

波斯文化知識問答

回答關於伊朗傳統節日和文化的問題

能準確識別雅爾達夜等傳統節日信息

信息檢索

專業技術文檔問答

從技術文檔中提取特定問題的答案

能準確回答拉普拉斯算子等專業問題

🚀 XLM - RoBERTa large用於問答（波斯語問答 - 🇮🇷）

這個模型是 [xlm - roberta - large](https://huggingface.co/xlm - roberta - large) 在波斯語問答數據集（PersianQA）上的微調版本，可有效處理波斯語的問答任務。

✨ 主要特性

多語言支持：支持波斯語以及其他多種語言。
問答領域適用：專注於問答任務，在波斯語問答數據集上有良好表現。
基於經典架構：基於XLM - RoBERTa large架構進行微調。

📦 安裝指南

文檔未提供具體安裝步驟，可參考相關庫的官方安裝說明，如transformers、torch等。

💻 使用示例

基礎用法

from transformers import AutoModelForQuestionAnswering, AutoTokenizer, pipeline

model_name_or_path = "m3hrdadfi/xlmr-large-qa-fa"
nlp = pipeline('question-answering', model=model_name_or_path, tokenizer=model_name_or_path)

context = """
شب یَلدا یا شب چلّه یکی از کهن‌ترین جشن‌های ایرانی است. 
در این جشن، طی شدن بلندترین شب سال و به دنبال آن بلندتر شدن طول روزها
 در نیم‌کرهٔ شمالی، که مصادف با انقلاب زمستانی است، گرامی داشته می‌شود. 
نام دیگر این شب «چِلّه» است، زیرا برگزاری این جشن، یک آیین ایرانی‌است.
"""
# Translation [EN]
# context = [
  # Yalda night or Cheleh night is one of the oldest Iranian celebrations. 
  # The festival celebrates the longest night of the year, followed by longer days in the Northern Hemisphere, 
  # which coincides with the Winter Revolution. 
  # Another name for this night is "Chelleh", because holding this celebration is an Iranian ritual.
# ]


questions = [
    "نام دیگر شب یلدا؟",
    "کهن ترین جشن ایرانی‌ها چه است؟",
    "شب یلدا مصادف با چه پدیده‌ای است؟"
]
# Translation [EN]
# questions = [
  # Another name for Yalda night?
  # What is the ancient tradition of Iranian celebration?
  # What phenomenon does Yalda night coincide with?
# ]


kwargs = {}

for question in questions:
    r = nlp(question=question, context=context, **kwargs)
    answer = " ".join([token.strip() for token in r["answer"].strip().split() if token.strip()])
    print(f"{question} {answer}")

輸出示例

نام دیگر شب یلدا؟ «چِلّه»
کهن ترین جشن ایرانی‌ها چه است؟ شب یَلدا یا شب چلّه
شب یلدا مصادف با چه پدیده‌ای است؟ انقلاب زمستانی

# Translation [EN]
# Another name for Yalda night? Cheleh night
# What is the ancient tradition of Iranian celebration? Yalda night or Chele night
# What phenomenon does Yalda night coincide with? Winter revolution

📚 詳細文檔

超參數

訓練過程中使用了以下超參數：

學習率（learning_rate）：2e - 05
訓練批次大小（train_batch_size）：8
評估批次大小（eval_batch_size）：8
隨機種子（seed）：42
梯度累積步數（gradient_accumulation_steps）：4
優化器（optimizer）：Adam，其中 betas = (0.9, 0.999)，epsilon = 1e - 08
學習率調度器類型（lr_scheduler_type）：線性
學習率調度器熱身比例（lr_scheduler_warmup_ratio）：0.1
訓練輪數（num_epochs）：20.0
混合精度訓練（mixed_precision_training）：原生自動混合精度（Native AMP）

性能

使用官方評估腳本在評估集上的評估結果如下：

評估集結果

"HasAns_exact": 58.678955453149,
"HasAns_f1": 82.3746683591845,
"HasAns_total": 651,
"NoAns_exact": 86.02150537634408,
"NoAns_f1": 86.02150537634408,
"NoAns_total": 279,
"exact": 66.88172043010752,
"f1": 83.46871946433232,
"total": 930