xquad-th-mbert-baseオープンソースタイ語質問応答モデル - 大文字と小文字の区別に対応し、タイ語の質問応答タスクに適用可能

ホーム

Xquad Th Mbert Base

zhufyによって開発

多言語BERTベースのタイ語抽出型質問応答モデルで、大文字小文字を区別でき、タイ語の質問応答タスクに適しています。

質問応答システム

Transformers

#タイ語質問応答 #多言語BERT #抽出型質問応答

ダウンロード数 16

リリース時間 : 3/11/2022

モデル概要

このモデルはタイ語の抽出型質問応答タスク用で、bert-base-multilingual-casedモデルをベースとしており、大文字小文字を区別できます。

モデル特徴

多言語サポート

多言語BERTモデルをベースとしており、タイ語を含む複数言語をサポートします。

大文字小文字の区別

大文字小文字を区別でき、例えば'english'と'English'の異なる表記を区別できます。

質問応答能力

タイ語の抽出型質問応答タスクに特化して最適化されています。

モデル能力

タイ語テキスト理解

抽出型質問応答

文脈理解

使用事例

質問応答システム

タイ語質問応答アプリケーション

タイ語の質問応答システムを構築し、与えられたテキストに基づいてユーザーの質問に答えます。

高精度な回答抽出

🚀 タイ語抽出型質問応答モデル

このモデルは、タイ語の抽出型質問応答に特化したものです。多言語BERTモデルをベースに構築されており、英語の大文字と小文字を区別して認識することができます。

🚀 クイックスタート

このモデルは、タイ語の抽出型質問応答タスクに使用されます。多言語BERT bert-base-multilingual-cased モデルをベースにしており、大文字と小文字を区別します。

✨ 主な機能

タイ語の抽出型質問応答タスクに特化したモデルです。
多言語BERTモデルをベースに構築されています。
大文字と小文字を区別して認識することができます。

📦 インストール

このモデルは、🤗 Transformers ライブラリを使用して直接利用することができます。

💻 使用例

基本的な使用法

>>> from transformers.pipelines import pipeline
>>> from transformers import AutoTokenizer, AutoModelForQuestionAnswering

>>> tokenizer = AutoTokenizer.from_pretrained("zhufy/xquad-th-mbert-base")
>>> model = AutoModelForQuestionAnswering.from_pretrained("zhufy/xquad-th-mbert-base")
>>> nlp = pipeline("question-answering", model=model, tokenizer=tokenizer)

>>> context = "ดินดอนสามเหลี่ยม ไรน์-เมิส ซึ่งเป็นภูมิภาคทางธรรมชาติที่สำคัญของเนเธอร์แลนด์เริ่มต้น ใกล้มิลลิงเงิน อาน เดอ เรน ใกล้ชายแดนเนเธอร์แลนด์ติดกับเยอรมัน โดยมีสาขาของไรน์ไหลเข้าสู่แม่น้ำวาลและเนเดอร์เรน เนื่องจากน้ำส่วนใหญ่จากแม่น้ำไรน์ คำว่า ดินดอนสามเหลี่ยมไรน์ ซึ่งสั้นกว่าจึงเป็นคำที่ใช้เรียกกันทั่วไป อย่างไรก็ดี ชื่อนี้ยังใช้เรียกดินดอนสามเหลี่ยมบริเวณแม่น้ำซึ่งแม่น้ำไรน์ไหลเข้าสู่ทะเลสาบคอนสแตนซ์อีกด้วย ดังนั้นการเรียกดินดอนสามเหลี่ยมซึ่งใหญ่กว่าว่าไรน์-เมิส หรือแม้กระทั่งดินแดนสามเหลี่ยมไรน์ -เมิส-สเกลต์จึงชัดเจนกว่า เนื่องจากแม่น้ำสเกลต์สิ้นสุดที่ดินดอนสามเหลี่ยมเดียวกัน"
              
>>> question = "ดินดอนสามเหลี่ยมในเนเธอร์แลนด์มีชื่อว่าอะไร?"

>>> inputs = {"question": question, 
            "context":context }
            
>>> nlp(inputs)

{'score': 0.9426798224449158,
 'start': 17,
 'end': 84,
 'answer': 'ไรน์-เมิส ซึ่งเป็นภูมิภาคทางธรรมชาติที่สำคัญของเนเธอร์แลนด์เริ่มต้น'}

📚 ドキュメント

モデルの説明

このモデルは、タイ語の抽出型質問応答に特化したものです。多言語BERT bert-base-multilingual-cased モデルをベースにしており、大文字と小文字を区別します。

学習データ

元の xquad データセットを学習/検証/テストセットに分割しました。学習/検証/テストセットには、それぞれ34/7/7の記事から876/161/153の質問と回答のペアが含まれています。データセットの詳細はこちら xquad_split で確認できます。

プロパティ	詳細
モデルタイプ	タイ語抽出型質問応答モデル
学習データ	元の xquad データセットを学習/検証/テストセットに分割したもの