Aeona开源聊天机器人 - 支持上下文记忆，提供个性化自然对话交互

首页

Aeona

由 deepparag 开发

Aeona是一款基于DialoGPT-small开发的生成式AI聊天机器人，专注于自然对话交互，支持上下文记忆和个性化回复

对话系统

Transformers

开源协议:MIT #上下文对话生成 #Discord场景优化 #动态个性调整

下载量 57

发布时间 : 3/2/2022

模型简介

Aeona是一款旨在模拟人类朋友交流方式的聊天机器人，主要部署在Discord平台。它能分析对话上下文并动态调整回复风格，实现更自然的交流体验。

模型特点

上下文感知对话

能记忆最多6条消息的对话历史，实现连贯的上下文交流

个性自适应

通过分析对话者特征动态调整回复风格

混合数据集训练

结合电影台词、Discord消息和个人消息数据集，实现广泛话题覆盖

AIML协同工作

设计为与AIML系统互补工作，在AIML失效时提供智能回复

模型能力

自然语言对话

上下文理解

个性化回复生成

多轮对话维持

使用案例

社交陪伴

Discord聊天机器人

在Discord平台提供拟人化聊天体验

实现类似人类朋友的交流感受

AI辅助

对话系统补充

与AIML系统配合使用，填补规则引擎的不足

提升对话系统的覆盖范围和灵活性

🚀 Aeona | 聊天机器人

Aeona是一款基于生成式AI技术的聊天机器人，它能够像朋友一样与人类进行交流，主要面向Discord平台。借助特定的模型和数据集训练，它在对话生成方面表现出色，还可与AIML聊天机器人配合使用，以提升性能。

🚀 快速开始

Aeona是一个使用 microsoft/DialoGPT-small 构建的生成式AI。建议将其与 AIML聊天机器人配合使用，这样可以减轻负载、获得更好的回复，并为你的机器人赋予名称和个性。使用AIML聊天机器人还能硬编码一些回复。你可以点击此处邀请该机器人。若想了解更多关于此项目的信息并与AI聊天，可访问此网站。

✨ 主要特性

友好交流：Aeona希望能够像朋友一样与人类交谈，其主要目标平台是Discord。
个性适应：它会利用之前消息的上下文，推测与之交谈的人类的个性，并调整自己的个性，以便更好地与用户交流。
结合AIML：与AIML聊天机器人配合使用，可减轻负载、获得更好的回复，还能为机器人赋予名称和个性，同时可以硬编码一些回复。

📦 安装指南

暂未提供相关安装步骤。

💻 使用示例

基础用法

from transformers import AutoTokenizer, AutoModelWithLMHead
  
tokenizer = AutoTokenizer.from_pretrained("deepparag/Aeona")
model = AutoModelWithLMHead.from_pretrained("deepparag/Aeona")
# Let's chat for 4 lines
for step in range(4):
    # encode the new user input, add the eos_token and return a tensor in Pytorch
    new_user_input_ids = tokenizer.encode(input(">> User:") + tokenizer.eos_token, return_tensors='pt')
    # print(new_user_input_ids)
    # append the new user input tokens to the chat history
    bot_input_ids = torch.cat([chat_history_ids, new_user_input_ids], dim=-1) if step > 0 else new_user_input_ids
    # generated a response while limiting the total chat history to 1000 tokens, 
    chat_history_ids = model.generate(
        bot_input_ids, max_length=200,
        pad_token_id=tokenizer.eos_token_id,  
        no_repeat_ngram_size=4,       
        do_sample=True, 
        top_k=100, 
        top_p=0.7,
        temperature=0.8
    )
    
    # pretty print last ouput tokens from bot
    print("Aeona: {}".format(tokenizer.decode(chat_history_ids[:, bot_input_ids.shape[-1]:][0], skip_special_tokens=True)))

🔧 技术细节

目标

目标是创建一个能与AIML协同工作的AI，以打造最像人类的AI。

为何不单独使用AI？

与AIML相比，AI实际上不可能了解用户并存储他们的数据，而AIML甚至可以执行代码！AI的目标是在AIML无法处理时生成回复。因此，目标是打造一个知识广泛但尽可能小巧的AI！为此使用了3个数据集：

Movielines：电影台词有助于生成更长、更有深度的回复，但可能非常随机，约有200k条台词！
Discord Messages：这些消息涵盖广泛的主题，经过过滤并去除了垃圾信息，这使得AI具有很高的随机性，并能对日常问题给出非常随机的回复，约有1.2亿条消息！
自定义数据集：从个人消息中提取，这些消息范围较窄，使用此数据集训练并随机回复会使AI经常说抱歉！