rugpt_chitchat開源模型 - 免費支持俄語閒聊及常識推理對話

首頁

Rugpt Chitchat

由inkoziev開發

一個支持俄語閒聊對話和常識推理的生成模型，基於GPT-2架構

大型語言模型

Transformers

其他#俄語閒聊對話 #常識推理 #數學計算

下載量 70

發布時間 : 9/15/2022

模型概述

該模型是對話系統的核心組件，具備俄語閒聊對話生成和基於給定事實進行常識推理兩大功能，能解決簡單算術題和邏輯問題

模型特點

俄語閒聊對話

能生成自然流暢的俄語對話回覆，支持多輪上下文理解

常識推理

基於給定事實進行邏輯推理和問題解答，支持三段論等推理方式

算術能力

能解決小學1-2年級水平的簡單算術題，測試準確率達91%

信息篩選

能從冗餘信息中自動篩選關鍵事實進行回答

模型能力

俄語文本生成

多輪對話

常識推理

簡單算術計算

邏輯推理

使用案例

對話系統

閒聊機器人

用於構建俄語聊天機器人

生成自然流暢的對話回覆

問答系統

事實問答

基於給定事實回答問題

準確率91%的算術題解答能力

邏輯推理

進行簡單的三段論推理

能處理隱含前提的推理問題

🚀 俄羅斯閒聊、演繹與常識推理模型

本模型是對話系統原型的核心，具備兩大主要功能。

🚀 快速開始

該模型可用於生成閒聊回覆和基於額外事實或“常識”回答問題。以下是使用示例：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM


device = "cuda" if torch.cuda.is_available() else "cpu"
model_name = "inkoziev/rugpt_chitchat"
tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.add_special_tokens({'bos_token': '<s>', 'eos_token': '</s>', 'pad_token': '<pad>'})
model = AutoModelForCausalLM.from_pretrained(model_name)
model.to(device)
model.eval()

# 向模型輸入對話的最後2 - 3條回覆。每條回覆單獨一行，以符號“-”開頭
input_text = """<s>- Привет! Что делаешь?
- Привет :) В такси еду
-"""

encoded_prompt = tokenizer.encode(input_text, add_special_tokens=False, return_tensors="pt").to(device)

output_sequences = model.generate(input_ids=encoded_prompt, max_length=100, num_return_sequences=1, pad_token_id=tokenizer.pad_token_id)

text = tokenizer.decode(output_sequences[0].tolist(), clean_up_tokenization_spaces=True)[len(input_text)+1:]
text = text[: text.find('</s>')]
print(text)

✨ 主要特性

閒聊回覆生成

以對話歷史（前1 - 10條回覆）作為輸入，模型可生成閒聊回覆。示例如下：

- Привет, как дела?
- Привет, так себе.
- <<< 期望模型生成此回覆 >>>

問題回答

模型可根據額外事實或“常識”回答問題。相關事實可通過其他模型（如 sbert_pq）從外部知識庫中提取。使用這些事實和問題文本，模型會構建語法正確且儘可能簡潔的答案，就像人類在類似交流場景中所做的那樣。相關事實應置於問題文本之前，就像對話夥伴直接說出一樣。例如：

- Сегодня 15 сентября. Какой сейчас у нас месяц?
- Сентябрь

模型不要求添加到對話上下文中的所有事實都與問題相關，因此從知識庫中提取信息的模型可以犧牲準確性來換取完整性，並添加一些額外信息。在這種情況下，閒聊模型會自行選擇上下文中的必要信息並忽略多餘信息。當前版本的模型允許在問題前添加最多5個事實。例如：

- Стасу 16 лет. Стас живет в Подольске. У Стаса нет своей машины. Где живет Стас?
- в Подольске

邏輯推理

在某些情況下，模型可以基於兩個相互關聯的前提進行邏輯推理得出答案。從兩個前提得出的結論並非明確表述，而是似乎用於推導答案。例如：

- Смертен ли Аристофан, если он был греческим философом, а все философы смертны?
- Да

算術問題解決

除了邏輯推理，模型還能解決小學1 - 2年級水平、包含兩個數字參數的簡單算術問題。例如：

- Чему равно 2+8?
- 10

📚 詳細文檔

模型變體與指標

目前發佈的模型有7.6億個參數，即達到了 sberbank - ai/rugpt3large_based_on_gpt2 的水平。以下是在預留測試樣本集上解決算術問題的準確率測量結果：

屬性	詳情
模型類型	不同基礎模型在算術問題解決上的準確率
訓練數據	未提及

基礎模型	算術準確率
sberbank - ai/rugpt3large_based_on_gpt2	0.91
sberbank - ai/rugpt3medium_based_on_gpt2	0.70
sberbank - ai/rugpt3small_based_on_gpt2	0.58
tinkoff - ai/ruDialoGPT - small	0.44
tinkoff - ai/ruDialoGPT - medium	0.69

“算術準確率”列中的0.91表示91%的測試問題得到了完全正確的解答。生成的答案與標準答案的任何偏差都被視為錯誤。例如，給出答案“120”而非“119”也會被記錄為錯誤。

📄 許可證

本模型採用 Unlicense 許可證。

📞 聯繫方式

如果您在使用此模型時遇到問題，或有改進建議，請發送郵件至 mentalcomputing@gmail.com。

📖 引用格式

@MISC{rugpt_chitchat,
    author  = {Ilya Koziev},
    title   = {Russian Chit - chat with Common sence Reasoning},
    url     = {https://huggingface.co/inkoziev/rugpt_chitchat},
    year    = 2022
}