🚀 Den4ikAI/ruBert-tiny-questions-classifier
本模型可将问题分为以下两类:
- 精确问题(exact_question)—— 需要明确、事实性答案的问题。
- 模糊问题(innacurate_question)—— 允许进行推理、哲学探讨的问题。
🚀 快速开始
本模型能够对问题进行分类,帮助用户区分精确问题和模糊问题。
✨ 主要特性
💻 使用示例
基础用法
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification
class RuBertQuestionClassifier:
def __init__(self):
self.device = torch.device("cpu")
self.tokenizer = AutoTokenizer.from_pretrained("Den4ikAI/ruBert-tiny-questions-classifier")
self.model = AutoModelForSequenceClassification.from_pretrained("Den4ikAI/ruBert-tiny-questions-classifier").to(
self.device).eval()
self.classes = ['exact_question', 'inaccurate_question']
def get_question_type(self, text):
text = text.lower().replace(',', '').replace('?', '')
inputs = self.tokenizer(text, max_length=512, add_special_tokens=False, truncation=True,
return_tensors='pt').to(self.device)
with torch.no_grad():
logits = self.model(**inputs).logits
probas = list(torch.sigmoid(logits)[0].cpu().detach().numpy())
out = self.classes[probas.index(max(probas))]
self.logger.debug('Mode: {}'.format(out))
return out
classifier = RuBertQuestionClassifier()
print(classifier.get_question_type('когда я найду своего принца'))
print(classifier.get_question_type('что такое цианид'))
📄 许可证
本项目采用 MIT 许可证。
📚 引用
@MISC{Den4ikAI/ruBert-tiny-questions-classifier,
author = {Denis Petrov},
title = {Russian question type classifier model},
url = {https://huggingface.co/Den4ikAI/ruBert-tiny-questions-classifier},
year = 2023
}