Aeona開源聊天機器人 - 支持上下文記憶，提供個性化自然對話交互

首頁

Aeona

由deepparag開發

Aeona是一款基於DialoGPT-small開發的生成式AI聊天機器人，專注於自然對話交互，支持上下文記憶和個性化回覆

對話系統

Transformers

開源協議:MIT #上下文對話生成 #Discord場景優化 #動態個性調整

下載量 57

發布時間 : 3/2/2022

模型概述

Aeona是一款旨在模擬人類朋友交流方式的聊天機器人，主要部署在Discord平臺。它能分析對話上下文並動態調整回覆風格，實現更自然的交流體驗。

模型特點

上下文感知對話

能記憶最多6條消息的對話歷史，實現連貫的上下文交流

個性自適應

通過分析對話者特徵動態調整回覆風格

混合數據集訓練

結合電影臺詞、Discord消息和個人消息數據集，實現廣泛話題覆蓋

AIML協同工作

設計為與AIML系統互補工作，在AIML失效時提供智能回覆

模型能力

自然語言對話

上下文理解

個性化回覆生成

多輪對話維持

使用案例

社交陪伴

Discord聊天機器人

在Discord平臺提供擬人化聊天體驗

實現類似人類朋友的交流感受

AI輔助

對話系統補充

與AIML系統配合使用，填補規則引擎的不足

提升對話系統的覆蓋範圍和靈活性

🚀 Aeona | 聊天機器人

Aeona是一款基於生成式AI技術的聊天機器人，它能夠像朋友一樣與人類進行交流，主要面向Discord平臺。藉助特定的模型和數據集訓練，它在對話生成方面表現出色，還可與AIML聊天機器人配合使用，以提升性能。

🚀 快速開始

Aeona是一個使用 microsoft/DialoGPT-small 構建的生成式AI。建議將其與 AIML聊天機器人配合使用，這樣可以減輕負載、獲得更好的回覆，併為你的機器人賦予名稱和個性。使用AIML聊天機器人還能硬編碼一些回覆。你可以點擊此處邀請該機器人。若想了解更多關於此項目的信息並與AI聊天，可訪問此網站。

✨ 主要特性

友好交流：Aeona希望能夠像朋友一樣與人類交談，其主要目標平臺是Discord。
個性適應：它會利用之前消息的上下文，推測與之交談的人類的個性，並調整自己的個性，以便更好地與用戶交流。
結合AIML：與AIML聊天機器人配合使用，可減輕負載、獲得更好的回覆，還能為機器人賦予名稱和個性，同時可以硬編碼一些回覆。

📦 安裝指南

暫未提供相關安裝步驟。

💻 使用示例

基礎用法

from transformers import AutoTokenizer, AutoModelWithLMHead
  
tokenizer = AutoTokenizer.from_pretrained("deepparag/Aeona")
model = AutoModelWithLMHead.from_pretrained("deepparag/Aeona")
# Let's chat for 4 lines
for step in range(4):
    # encode the new user input, add the eos_token and return a tensor in Pytorch
    new_user_input_ids = tokenizer.encode(input(">> User:") + tokenizer.eos_token, return_tensors='pt')
    # print(new_user_input_ids)
    # append the new user input tokens to the chat history
    bot_input_ids = torch.cat([chat_history_ids, new_user_input_ids], dim=-1) if step > 0 else new_user_input_ids
    # generated a response while limiting the total chat history to 1000 tokens, 
    chat_history_ids = model.generate(
        bot_input_ids, max_length=200,
        pad_token_id=tokenizer.eos_token_id,  
        no_repeat_ngram_size=4,       
        do_sample=True, 
        top_k=100, 
        top_p=0.7,
        temperature=0.8
    )
    
    # pretty print last ouput tokens from bot
    print("Aeona: {}".format(tokenizer.decode(chat_history_ids[:, bot_input_ids.shape[-1]:][0], skip_special_tokens=True)))

🔧 技術細節

目標

目標是創建一個能與AIML協同工作的AI，以打造最像人類的AI。

為何不單獨使用AI？

與AIML相比，AI實際上不可能瞭解用戶並存儲他們的數據，而AIML甚至可以執行代碼！AI的目標是在AIML無法處理時生成回覆。因此，目標是打造一個知識廣泛但儘可能小巧的AI！為此使用了3個數據集：

Movielines：電影臺詞有助於生成更長、更有深度的回覆，但可能非常隨機，約有200k條臺詞！
Discord Messages：這些消息涵蓋廣泛的主題，經過過濾並去除了垃圾信息，這使得AI具有很高的隨機性，並能對日常問題給出非常隨機的回覆，約有1.2億條消息！
自定義數據集：從個人消息中提取，這些消息範圍較窄，使用此數據集訓練並隨機回覆會使AI經常說抱歉！