bert-base-fa-qaオープンソースペルシア語質問応答モデル - 無料でデプロイしてペルシア語質問応答タスクを支援します

ホーム

Bert Base Fa Qa

SajjadAyoubiによって開発

BERTアーキテクチャに基づくペルシア語質問応答モデルで、ペルシア語の質問応答タスクに特化して設計されています。

質問応答システム #ペルシア語質問応答 #BERTアーキテクチャ #無回答検出

ダウンロード数 115

リリース時間 : 3/2/2022

モデル概要

このモデルは、ペルシア語の質問応答タスクに最適化されたBERTモデルで、与えられたテキストから質問の答えを抽出することができます。

モデル特徴

ペルシア語対応

ペルシア語に特化して最適化された質問応答モデルで、ペルシア語の質問を正確に理解して回答することができます。

効率的な質問応答

与えられたテキストから迅速に質問の答えを抽出することができ、バッチ処理もサポートしています。

柔軟な呼び出し

パイプラインモードと手動呼び出しモードでの使用をサポートし、さまざまなニーズに対応します。

モデル能力

テキスト理解

質問応答抽出

ペルシア語処理

使用事例

教育

ペルシア語学習支援

学生がペルシア語のテキストから迅速に質問の答えを見つけるのを支援します。

学習効率を向上させ、検索時間を短縮します。

情報検索

ペルシア語ドキュメントの質問応答

ペルシア語のドキュメントから特定の質問の答えを抽出します。

必要な情報を迅速に取得し、検索効率を向上させます。

🚀 クイックスタート

このプロジェクトでは、Transformersライブラリを使用して質問応答タスクを行う方法を提供しています。以下に、使用方法を詳しく説明します。

📦 インストール

Transformersを使用するには、transformersとsentencepieceが必要です。どちらもpipを使ってインストールできます。

pip install transformers sentencepiece

💻 使用例

基本的な使用法

パイプライン 🚀

Transformersに不慣れな場合は、パイプラインを使用することができます。ただし、パイプラインでは質問に対する回答がない場合をサポートしていません。

from transformers import pipeline

model_name = "SajjadAyoubi/bert-base-fa-qa"
qa_pipeline = pipeline("question-answering", model=model_name, tokenizer=model_name)

text = "سلام من سجاد ایوبی هستم ۲۰ سالمه و به پردازش زبان طبیعی علاقه دارم"
questions = ["اسمم چیه؟", "چند سالمه؟", "به چی علاقه دارم؟"]

for question in questions:
    print(qa_pipeline({"context": text, "question": question}))

>>> {'score': 0.4839823544025421, 'start': 8, 'end': 18, 'answer': 'سجاد ایوبی'}
>>> {'score': 0.3747948706150055, 'start': 24, 'end': 32, 'answer': '۲۰ سالمه'}
>>> {'score': 0.5945395827293396, 'start': 38, 'end': 55, 'answer': 'پردازش زبان طبیعی'}

高度な使用法

手動アプローチ 🔥

手動アプローチを使用すると、回答がない場合をサポートし、さらに良いパフォーマンスを得ることができます。

PyTorch

from transformers import AutoTokenizer, AutoModelForQuestionAnswering
from src.utils import AnswerPredictor

model_name = "SajjadAyoubi/bert-base-fa-qa"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForQuestionAnswering.from_pretrained(model_name)

text = "سلام من سجاد ایوبی هستم ۲۰ سالمه و به پردازش زبان طبیعی علاقه دارم"
questions = ["اسمم چیه؟", "چند سالمه؟", "به چی علاقه دارم؟"]

# this class is from src/utils.py and you can read more about it
predictor = AnswerPredictor(model, tokenizer, device="cpu", n_best=10)
preds = predictor(questions, [text] * 3, batch_size=3)

for k, v in preds.items():
    print(v)

以下のような出力が得られます：

100%|██████████| 1/1 [00:00<00:00,  3.56it/s]
{'score': 8.040637016296387, 'text': 'سجاد ایوبی'}
{'score': 9.901972770690918, 'text': '۲۰'}
{'score': 12.117212295532227, 'text': 'پردازش زبان طبیعی'}

TensorFlow 2.X

from transformers import AutoTokenizer, TFAutoModelForQuestionAnswering
from src.utils import TFAnswerPredictor

model_name = "SajjadAyoubi/bert-base-fa-qa"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = TFAutoModelForQuestionAnswering.from_pretrained(model_name)

text = "سلام من سجاد ایوبی هستم ۲۰ سالمه و به پردازش زبان طبیعی علاقه دارم"
questions = ["اسمم چیه؟", "چند سالمه؟", "به چی علاقه دارم؟"]

# this class is from src/utils.py, you can read more about it
predictor = TFAnswerPredictor(model, tokenizer, n_best=10)
preds = predictor(questions, [text] * 3, batch_size=3)

for k, v in preds.items():
    print(v)

以下のような出力が得られます：

100%|██████████| 1/1 [00:00<00:00,  3.56it/s]
{'score': 8.040637016296387, 'text': 'سجاد ایوبی'}
{'score': 9.901972770690918, 'text': '۲۰'}
{'score': 12.117212295532227, 'text': 'پردازش زبان طبیعی'}

また、Google Colab上のHowToUse iPython Notebookを使用して全体のデモを確認することもできます。