xlm-roberta-large-fa-qaオープンソースペルシャ語質問応答モデル - 無料でデプロイして質問応答タスクを最適化する

ホーム

Xlm Roberta Large Fa Qa

SajjadAyoubiによって開発

RoBERTaアーキテクチャに基づくペルシア語の質問応答モデルで、ペルシア語の質問応答タスクに対して最適化されています。

質問応答システム

Transformers

#ペルシア語の質問応答 #無回答検出 #RoBERTaアーキテクチャ

ダウンロード数 141

リリース時間 : 3/2/2022

モデル概要

このモデルはRoBERTaアーキテクチャに基づく大型のペルシア語の質問応答モデルで、ペルシア語の質問応答タスクを処理するために特別に設計されています。与えられたテキストから質問の答えを抽出することができ、手動呼び出しと高速パイプライン呼び出しの2つのモードをサポートしています。

モデル特徴

ペルシア語最適化

ペルシア語に対して特別に最適化されており、ペルシア語のテキストをより良く理解して処理することができます。

無回答判断をサポート

手動呼び出しモードでは、質問がテキストに答えがないかどうかを判断することをサポートしています。

高性能

モデルはペルシア語の質問応答タスクで優れた性能を発揮し、テキストから正確に答えを抽出することができます。

モデル能力

ペルシア語テキスト理解

質問応答抽出

無回答判断

使用事例

教育

ペルシア語学習支援

学生がペルシア語のテキストから質問の答えをすばやく見つけるのを支援します。

学習効率を向上させ、迅速に知識を取得することができます。

カスタマーサービス

自動質問応答システム

ペルシア語のカスタマーサービスにおける自動質問応答に使用され、顧客の質問に迅速に応答します。

人工客服の負担を軽減し、応答速度を向上させます。

🚀 クイックスタート

このプロジェクトは、Transformersライブラリを使用した質問応答システムです。必要なライブラリをインストールし、簡単なコードで質問に対する回答を取得できます。

✨ 主な機能

pipelinesを使用した簡単な質問応答
手動アプローチによる高性能な質問応答
PyTorchとTensorFlow 2.Xの両方に対応

📦 インストール

Transformersでは、transformersとsentencepieceが必要です。どちらもpipを使ってインストールできます。

pip install transformers sentencepiece

💻 使用例

基本的な使用法

Transformersに不慣れな場合は、pipelinesを代わりに使用できます。ただし、pipelinesでは質問に対して「回答なし」を返すことはできません。

from transformers import pipeline

model_name = "SajjadAyoubi/lm-roberta-large-fa-qa"
qa_pipeline = pipeline("question-answering", model=model_name, tokenizer=model_name)

text = "سلام من سجاد ایوبی هستم ۲۰ سالمه و به پردازش زبان طبیعی علاقه دارم"
questions = ["اسمم چیه؟", "چند سالمه؟", "به چی علاقه دارم؟"]

for question in questions:
    print(qa_pipeline({"context": text, "question": question}))

>>> {'score': 0.4839823544025421, 'start': 8, 'end': 18, 'answer': 'سجاد ایوبی'}
>>> {'score': 0.3747948706150055, 'start': 24, 'end': 32, 'answer': '۲۰ سالمه'}
>>> {'score': 0.5945395827293396, 'start': 38, 'end': 55, 'answer': 'پردازش زبان طبیعی'}

高度な使用法

手動アプローチを使用すると、「回答なし」の結果を得ることができ、さらに高性能な結果を得ることができます。

PyTorch

from transformers import AutoTokenizer, AutoModelForQuestionAnswering
from src.utils import AnswerPredictor

model_name = "SajjadAyoubi/lm-roberta-large-fa-qa"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForQuestionAnswering.from_pretrained(model_name)

text = "سلام من سجاد ایوبی هستم ۲۰ سالمه و به پردازش زبان طبیعی علاقه دارم"
questions = ["اسمم چیه؟", "چند سالمه؟", "به چی علاقه دارم؟"]

# this class is from src/utils.py and you can read more about it
predictor = AnswerPredictor(model, tokenizer, device="cpu", n_best=10)
preds = predictor(questions, [text] * 3, batch_size=3)

for k, v in preds.items():
    print(v)

以下のような出力が得られます。

100%|██████████| 1/1 [00:00<00:00,  3.56it/s]
{'score': 8.040637016296387, 'text': 'سجاد ایوبی'}
{'score': 9.901972770690918, 'text': '۲۰'}
{'score': 12.117212295532227, 'text': 'پردازش زبان طبیعی'}

TensorFlow 2.X

from transformers import AutoTokenizer, TFAutoModelForQuestionAnswering
from src.utils import TFAnswerPredictor

model_name = "SajjadAyoubi/lm-roberta-large-fa-qa"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = TFAutoModelForQuestionAnswering.from_pretrained(model_name)

text = "سلام من سجاد ایوبی هستم ۲۰ سالمه و به پردازش زبان طبیعی علاقه دارم"
questions = ["اسمم چیه؟", "چند سالمه؟", "به چی علاقه دارم؟"]

# this class is from src/utils.py, you can read more about it
predictor = TFAnswerPredictor(model, tokenizer, n_best=10)
preds = predictor(questions, [text] * 3, batch_size=3)

for k, v in preds.items():
    print(v)

以下のような出力が得られます。

100%|██████████| 1/1 [00:00<00:00,  3.56it/s]
{'score': 8.040637016296387, 'text': 'سجاد ایوبی'}
{'score': 9.901972770690918, 'text': '۲۰'}
{'score': 12.117212295532227, 'text': 'پردازش زبان طبیعی'}

また、Google Colab上のHowToUse iPython Notebookを使用して全体のデモンストレーションにアクセスすることもできます。