B

Buddhi 128k Chat 7b

由aiplanet開發
Buddhi-128k-Chat 是一款具有 128K 上下文窗口的通用首款聊天模型,基於 Mistral 7B Instruct 進行了精細微調,並通過創新的 YaRN 技術優化,可處理長達 128,000 個標記的擴展上下文長度。
下載量 196
發布時間 : 4/2/2024

模型概述

Buddhi-128k-Chat 是一款具有 128K 上下文窗口的通用首款聊天模型。它基於 Mistral 7B Instruct 進行了精細微調,並通過創新的 YaRN(Yet another Rope Extension)技術優化,可處理長達 128,000 個標記的擴展上下文長度。這一增強功能使 Buddhi 能夠在長文檔或對話中保持對上下文的深入理解,尤其擅長需要廣泛上下文保留的任務,如全面的文檔摘要、詳細的敘事生成和複雜的問答。

模型特點

128K 上下文窗口
通過 YaRN 技術擴展了上下文窗口至 128K,能夠處理超長文本和複雜對話
基於 Mistral-7B Instruct 微調
繼承了 Mistral-7B Instruct 的卓越推理能力,並在長上下文任務上進行了優化
動態 YaRN 技術
採用 NTK-aware 動態調整技術,有效擴展了位置嵌入能力

模型能力

長文本理解
複雜對話處理
文檔摘要
敘事生成
問答系統

使用案例

文檔處理
長文檔摘要
對超長文檔進行全面的摘要生成
能夠在 128K 上下文窗口內保持對文檔內容的準確理解
整本書分析
對整本書籍內容進行分析和問答
可處理長達 75000 標記的書籍內容
對話系統
複雜對話
處理包含大量上下文的複雜對話
在長對話中保持上下文一致性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase