🚀 Den4ikAI/ruBert-tiny-questions-classifier
本模型可將問題分為以下兩類:
- 精確問題(exact_question)—— 需要明確、事實性答案的問題。
- 模糊問題(innacurate_question)—— 允許進行推理、哲學探討的問題。
🚀 快速開始
本模型能夠對問題進行分類,幫助用戶區分精確問題和模糊問題。
✨ 主要特性
💻 使用示例
基礎用法
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification
class RuBertQuestionClassifier:
def __init__(self):
self.device = torch.device("cpu")
self.tokenizer = AutoTokenizer.from_pretrained("Den4ikAI/ruBert-tiny-questions-classifier")
self.model = AutoModelForSequenceClassification.from_pretrained("Den4ikAI/ruBert-tiny-questions-classifier").to(
self.device).eval()
self.classes = ['exact_question', 'inaccurate_question']
def get_question_type(self, text):
text = text.lower().replace(',', '').replace('?', '')
inputs = self.tokenizer(text, max_length=512, add_special_tokens=False, truncation=True,
return_tensors='pt').to(self.device)
with torch.no_grad():
logits = self.model(**inputs).logits
probas = list(torch.sigmoid(logits)[0].cpu().detach().numpy())
out = self.classes[probas.index(max(probas))]
self.logger.debug('Mode: {}'.format(out))
return out
classifier = RuBertQuestionClassifier()
print(classifier.get_question_type('когда я найду своего принца'))
print(classifier.get_question_type('что такое цианид'))
📄 許可證
本項目採用 MIT 許可證。
📚 引用
@MISC{Den4ikAI/ruBert-tiny-questions-classifier,
author = {Denis Petrov},
title = {Russian question type classifier model},
url = {https://huggingface.co/Den4ikAI/ruBert-tiny-questions-classifier},
year = 2023
}