🚀 タイ語抽出型質問応答モデル
このモデルは、タイ語の抽出型質問応答に特化したものです。多言語BERTモデルをベースに構築されており、英語の大文字と小文字を区別して認識することができます。
🚀 クイックスタート
このモデルは、タイ語の抽出型質問応答タスクに使用されます。多言語BERT bert-base-multilingual-cased モデルをベースにしており、大文字と小文字を区別します。
✨ 主な機能
- タイ語の抽出型質問応答タスクに特化したモデルです。
- 多言語BERTモデルをベースに構築されています。
- 大文字と小文字を区別して認識することができます。
📦 インストール
このモデルは、🤗 Transformers ライブラリを使用して直接利用することができます。
💻 使用例
基本的な使用法
>>> from transformers.pipelines import pipeline
>>> from transformers import AutoTokenizer, AutoModelForQuestionAnswering
>>> tokenizer = AutoTokenizer.from_pretrained("zhufy/xquad-th-mbert-base")
>>> model = AutoModelForQuestionAnswering.from_pretrained("zhufy/xquad-th-mbert-base")
>>> nlp = pipeline("question-answering", model=model, tokenizer=tokenizer)
>>> context = "ดินดอนสามเหลี่ยม ไรน์-เมิส ซึ่งเป็นภูมิภาคทางธรรมชาติที่สำคัญของเนเธอร์แลนด์เริ่มต้น ใกล้มิลลิงเงิน อาน เดอ เรน ใกล้ชายแดนเนเธอร์แลนด์ติดกับเยอรมัน โดยมีสาขาของไรน์ไหลเข้าสู่แม่น้ำวาลและเนเดอร์เรน เนื่องจากน้ำส่วนใหญ่จากแม่น้ำไรน์ คำว่า ดินดอนสามเหลี่ยมไรน์ ซึ่งสั้นกว่าจึงเป็นคำที่ใช้เรียกกันทั่วไป อย่างไรก็ดี ชื่อนี้ยังใช้เรียกดินดอนสามเหลี่ยมบริเวณแม่น้ำซึ่งแม่น้ำไรน์ไหลเข้าสู่ทะเลสาบคอนสแตนซ์อีกด้วย ดังนั้นการเรียกดินดอนสามเหลี่ยมซึ่งใหญ่กว่าว่าไรน์-เมิส หรือแม้กระทั่งดินแดนสามเหลี่ยมไรน์ -เมิส-สเกลต์จึงชัดเจนกว่า เนื่องจากแม่น้ำสเกลต์สิ้นสุดที่ดินดอนสามเหลี่ยมเดียวกัน"
>>> question = "ดินดอนสามเหลี่ยมในเนเธอร์แลนด์มีชื่อว่าอะไร?"
>>> inputs = {"question": question,
"context":context }
>>> nlp(inputs)
{'score': 0.9426798224449158,
'start': 17,
'end': 84,
'answer': 'ไรน์-เมิส ซึ่งเป็นภูมิภาคทางธรรมชาติที่สำคัญของเนเธอร์แลนด์เริ่มต้น'}
📚 ドキュメント
モデルの説明
このモデルは、タイ語の抽出型質問応答に特化したものです。多言語BERT bert-base-multilingual-cased モデルをベースにしており、大文字と小文字を区別します。
学習データ
元の xquad データセットを学習/検証/テストセットに分割しました。学習/検証/テストセットには、それぞれ34/7/7の記事から876/161/153の質問と回答のペアが含まれています。データセットの詳細はこちら xquad_split で確認できます。
プロパティ |
詳細 |
モデルタイプ |
タイ語抽出型質問応答モデル |
学習データ |
元の xquad データセットを学習/検証/テストセットに分割したもの |