Aeonaオープンソースチャットボット - コンテキスト記憶をサポートし、個別化された自然な対話インタラクションを提供

ホーム

Aeona

deepparagによって開発

AeonaはDialoGPT-smallをベースに開発された生成型AIチャットボットで、自然な対話インタラクションに特化し、コンテキスト記憶と個性的な返信をサポートします。

対話システム

Transformers

オープンソースライセンス:MIT #コンテキスト対話生成 #Discordシーン最適化 #動的個性調整

ダウンロード数 57

リリース時間 : 3/2/2022

モデル概要

Aeonaは人間の友人との交流スタイルを模倣することを目的としたチャットボットで、主にDiscordプラットフォームにデプロイされます。対話のコンテキストを分析し、返信スタイルを動的に調整して、より自然な交流体験を実現します。

モデル特徴

コンテキスト感知対話

最大6つのメッセージの対話履歴を記憶し、一貫したコンテキスト交流を実現します。

個性適応

対話者の特徴を分析して返信スタイルを動的に調整します。

混合データセット訓練

映画のセリフ、Discordのメッセージ、個人のメッセージデータセットを組み合わせて、幅広いトピックをカバーします。

AIML協調作業

AIMLシステムと相補的に動作するように設計され、AIMLが機能しない場合にもスマートな返信を提供します。

モデル能力

自然言語対話

コンテキスト理解

個性的な返信生成

多輪対話維持

使用事例

社交コンパニオン

Discordチャットボット

Discordプラットフォームで擬人化されたチャット体験を提供します。

人間の友人のような交流感を実現します。

AI支援

対話システム補完

AIMLシステムと併用して、ルールエンジンの不足を補います。

対話システムのカバー範囲と柔軟性を向上させます。

🚀 Aeona | チャットボット

Aeonaは、生成型AI技術に基づくチャットボットです。人間と友人のように交流することができ、主にDiscordプラットフォームを対象としています。特定のモデルとデータセットを用いて訓練されており、会話生成において優れた性能を発揮します。また、AIMLチャットボットと連携することで、性能を向上させることができます。

🚀 クイックスタート

Aeonaは、microsoft/DialoGPT-small を使用して構築された生成型AIです。 AIMLチャットボットと一緒に使用することをおすすめします。これにより、負荷を軽減し、より良い返答を得ることができ、ボットに名前と個性を与えることができます。AIMLチャットボットを使用すると、いくつかの返答をハードコードすることもできます。ここをクリックすると、このボットを招待することができます。このプロジェクトに関する詳細情報を得たり、AIとチャットしたりするには、このウェブサイトを訪問してください。

✨ 主な機能

友好的な交流：Aeonaは、人間と友人のように会話することを目指しており、主なターゲットプラットフォームはDiscordです。
個性の適応：過去のメッセージのコンテキストを利用して、会話相手の人間の個性を推測し、自身の個性を調整して、ユーザーとより良く交流することができます。
AIMLとの連携：AIMLチャットボットと連携することで、負荷を軽減し、より良い返答を得ることができ、ボットに名前と個性を与えることができます。また、いくつかの返答をハードコードすることもできます。

💻 使用例

基本的な使用法

from transformers import AutoTokenizer, AutoModelWithLMHead
  
tokenizer = AutoTokenizer.from_pretrained("deepparag/Aeona")
model = AutoModelWithLMHead.from_pretrained("deepparag/Aeona")
# Let's chat for 4 lines
for step in range(4):
    # encode the new user input, add the eos_token and return a tensor in Pytorch
    new_user_input_ids = tokenizer.encode(input(">> User:") + tokenizer.eos_token, return_tensors='pt')
    # print(new_user_input_ids)
    # append the new user input tokens to the chat history
    bot_input_ids = torch.cat([chat_history_ids, new_user_input_ids], dim=-1) if step > 0 else new_user_input_ids
    # generated a response while limiting the total chat history to 1000 tokens, 
    chat_history_ids = model.generate(
        bot_input_ids, max_length=200,
        pad_token_id=tokenizer.eos_token_id,  
        no_repeat_ngram_size=4,       
        do_sample=True, 
        top_k=100, 
        top_p=0.7,
        temperature=0.8
    )
    
    # pretty print last ouput tokens from bot
    print("Aeona: {}".format(tokenizer.decode(chat_history_ids[:, bot_input_ids.shape[-1]:][0], skip_special_tokens=True)))

🔧 技術詳細

目標

AIMLと連携して、最も人間に近いAIを作成することを目標としています。

なぜAIを単独で使用しないのか？

AIMLと比較すると、AIは実際にはユーザーを理解し、彼らのデータを保存することは不可能です。一方、AIMLはコードを実行することさえできます！AIの目標は、AIMLが処理できない場合に返答を生成することです。したがって、目標は、広範な知識を持ちながら、できるだけ小さなAIを作成することです！このために、3つのデータセットを使用しています。

Movielines：映画のセリフは、より長く、より深い返答を生成するのに役立ちますが、非常にランダムな場合があります。約20万のセリフがあります！
Discord Messages：これらのメッセージは幅広いトピックをカバーしており、フィルタリングされてゴミ情報が取り除かれています。これにより、AIは非常にランダムな性質を持ち、日常的な質問に非常にランダムな返答をすることができます。約1億2000万のメッセージがあります！
カスタムデータセット：個人のメッセージから抽出されたもので、範囲が狭いです。このデータセットを使用して訓練し、ランダムな返答をすると、AIはしばしば謝罪することになります！