オープンソースのnf - cats質問応答分類モデル。無料でデプロイでき、非事実性の質問カテゴリを簡単に識別

ホーム

Nf Cats

Lurunchikによって開発

RoBERTaベースの質問分類モデルで、非事実的質問のカテゴリを識別

テキスト分類

Transformers

英語オープンソースライセンス:MIT #非事実質問分類 #RoBERTaファインチューニング #多クラス識別

ダウンロード数 245

リリース時間 : 7/13/2022

モデル概要

このモデルはNFQAデータセットで訓練され、非事実的質問を8種類（事実型、議論型、証拠型など）に分類可能

モデル特徴

多クラス分類

8種類の異なる非事実的質問を識別可能

RoBERTaベース最適化

roberta-base-squad2をベースモデルとし、SQuAD2.0データセットでファインチューニング

学術研究支援

ACM SIGIR会議論文研究に基づき開発

モデル能力

テキスト分類

質問タイプ識別

自然言語処理

使用事例

質問応答システム

インテリジェントカスタマーサポート

ユーザーの質問タイプを識別し、より正確な回答を提供

カスタマーサポートシステムの回答精度とユーザー体験向上

教育アプリケーション

学生が異なるタイプの質問の特徴と回答方法を理解するのを支援

学習効率と問題解決能力の向上

学術研究

質問分類研究

非事実的質問分類に関する研究に利用

情報検索分野の学術発展を支援

🚀 英語における非事実型質問カテゴリ分類

このプロジェクトは、英語の非事実型質問（NFQA）を分類するモデルに関するものです。NFQAモデルは特定のデータセットで学習され、質問のカテゴリを精度よく判断することができます。

🚀 クイックスタート

NFQAモデルについて

リポジトリ: https://github.com/Lurunchik/NF-CATS

このモデルはNFQAデータセットを使用して学習されています。ベースモデルはroberta-base-squad2で、SQuAD2.0データセットを用いて微調整された質問応答タスク向けのRoBERTaベースのモデルです。

以下のラベルを使用して質問を分類します： NOT-A-QUESTION、FACTOID、DEBATE、EVIDENCE-BASED、INSTRUCTION、REASON、EXPERIENCE、COMPARISON

📦 インストール

このセクションでは、HuggingFaceを使用してNFQAモデルを使う方法を説明します。

NFQAモデルとトークナイザーの読み込み

from transformers import AutoTokenizer
from nfqa_model import RobertaNFQAClassification 

nfqa_model = RobertaNFQAClassification.from_pretrained("Lurunchik/nf-cats")
nfqa_tokenizer = AutoTokenizer.from_pretrained("deepset/roberta-base-squad2")

ヘルパー関数を使用した予測

def get_nfqa_category_prediction(text):
    output = nfqa_model(**nfqa_tokenizer(text, return_tensors="pt"))
    index = output.logits.argmax()
    return nfqa_model.config.id2label[int(index)]

get_nfqa_category_prediction('how to assign category?')
# 結果
#'INSTRUCTION'

💻 使用例

基本的な使用法

from transformers import AutoTokenizer
from nfqa_model import RobertaNFQAClassification 

nfqa_model = RobertaNFQAClassification.from_pretrained("Lurunchik/nf-cats")
nfqa_tokenizer = AutoTokenizer.from_pretrained("deepset/roberta-base-squad2")

def get_nfqa_category_prediction(text):
    output = nfqa_model(**nfqa_tokenizer(text, return_tensors="pt"))
    index = output.logits.argmax()
    return nfqa_model.config.id2label[int(index)]

get_nfqa_category_prediction('how to assign category?')
# 結果
#'INSTRUCTION'

📚 ドキュメント

デモ

hugginface spaceを通じてモデルをテストすることができます。

引用

もしあなたの研究やプロジェクトでNFQA-catsを使用する場合は、この論文を引用してください。

@misc{bolotova2022nfcats,
        author = {Bolotova, Valeriia and Blinov, Vladislav and Scholer, Falk and Croft, W. Bruce and Sanderson, Mark},
        title = {A Non-Factoid Question-Answering Taxonomy},
        year = {2022},
        isbn = {9781450387323},
        publisher = {Association for Computing Machinery},
        address = {New York, NY, USA},
        url = {https://doi.org/10.1145/3477495.3531926},
        doi = {10.1145/3477495.3531926},
        booktitle = {Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval},
        pages = {1196–1207},
        numpages = {12},
        keywords = {question taxonomy, non-factoid question-answering, editorial study, dataset analysis},
        location = {Madrid, Spain},
        series = {SIGIR '22}
}

Enjoy! 🤗