M

Mpt 7b Chat

由mosaicml開發
MPT-7B-Chat是一款專為對話生成設計的類聊天機器人模型,基於MPT-7B基礎模型在多個對話數據集上微調而成。
下載量 85.84k
發布時間 : 5/4/2023

模型概述

該模型專注於對話生成任務,採用改進的解碼器專用Transformer架構,支持長上下文對話生成。

模型特點

長上下文支持
通過ALiBi技術支持擴展到4096 tokens的上下文長度
高效訓練架構
採用FlashAttention、QK LayerNorm等技術優化訓練效率
多數據集微調
在ShareGPT-Vicuna、HC3等多個高質量對話數據集上微調

模型能力

對話生成
指令跟隨
文本摘要
內容創作

使用案例

智能助手
客服對話系統
構建自動客服對話系統
可生成自然流暢的客服回覆
內容創作
社交媒體內容生成
根據新聞摘要生成社交媒體推文
如示例中生成的宣傳推文
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase