Ko-DialoGPT開源韓語對話模型 - 免費部署生成自然韓語對話響應

首頁

Ko DialoGPT

由byeongal開發

這是一個基於GPT-2架構的韓語對話生成模型，專門用於生成自然的韓語對話響應。

對話系統

Transformers

韓語#韓語對話生成 #多輪對話處理 #GPT2架構優化

下載量 19

發布時間 : 3/2/2022

模型概述

該模型是基於GPT-2架構的韓語對話生成模型，能夠根據用戶輸入生成連貫的韓語對話響應。

模型特點

韓語對話優化

專門針對韓語對話場景進行優化，能夠生成自然流暢的韓語對話響應。

上下文感知

能夠記住並利用對話歷史上下文，生成更連貫的對話響應。

基於GPT-2架構

利用GPT-2強大的語言理解和生成能力，確保高質量的對話生成。

模型能力

韓語對話生成

上下文感知對話

多輪對話處理

使用案例

聊天機器人

韓語客服機器人

用於韓語客服場景，自動回答客戶問題

提高客服效率，降低人力成本

韓語社交聊天機器人

用於社交平臺上的韓語對話伴侶

提供自然的韓語對話體驗

語言學習

韓語學習助手

幫助韓語學習者練習對話

提供真實的韓語對話環境

🚀 韓語對話生成預訓練模型（Ko - DialoGPT）

Ko - DialoGPT是一個用於對話生成的預訓練模型，它基於GPT2架構，能夠處理韓語對話場景，為用戶提供流暢的對話交互體驗。

🚀 快速開始

以下是如何使用Ko - DialoGPT模型的示例代碼：

from transformers import PreTrainedTokenizerFast, GPT2LMHeadModel
import torch


device = 'cuda' if torch.cuda.is_available() else 'cpu'

tokenizer = PreTrainedTokenizerFast.from_pretrained('byeongal/Ko-DialoGPT')
model = GPT2LMHeadModel.from_pretrained('byeongal/Ko-DialoGPT').to(device)

past_user_inputs = []
generated_responses = []

while True:
    user_input = input(">> User:")
    if user_input == 'bye':
        break
    text_idx = tokenizer.encode(user_input + tokenizer.eos_token, return_tensors='pt')
    for i in range(len(generated_responses)-1, len(generated_responses)-3, -1):
        if i < 0:
            break
        encoded_vector = tokenizer.encode(generated_responses[i] + tokenizer.eos_token, return_tensors='pt')
        if text_idx.shape[-1] + encoded_vector.shape[-1] < 1000:
            text_idx = torch.cat([encoded_vector, text_idx], dim=-1)
        else:
            break
        encoded_vector = tokenizer.encode(past_user_inputs[i] + tokenizer.eos_token, return_tensors='pt')
        if text_idx.shape[-1] + encoded_vector.shape[-1] < 1000:
            text_idx = torch.cat([encoded_vector, text_idx], dim=-1)
        else:
            break
    text_idx = text_idx.to(device)
    inference_output = model.generate(
            text_idx,
            max_length=1000,
            num_beams=5,
            top_k=20,
            no_repeat_ngram_size=4,
            length_penalty=0.65,
            repetition_penalty=2.0,
        )
    inference_output = inference_output.tolist()
    bot_response = tokenizer.decode(inference_output[0][text_idx.shape[-1]:], skip_special_tokens=True)
    print(f"Bot: {bot_response}")
    past_user_inputs.append(user_input)
    generated_responses.append(bot_response)