M

Mistrallite

由amazon開發
MistralLite是基於Mistral-7B-v0.1微調的語言模型,增強了處理長上下文(最高達32K tokens)的能力,適用於長上下文檢索與問答等場景。
下載量 20.24k
發布時間 : 10/16/2023

模型概述

MistralLite是一個優化了長上下文處理能力的語言模型,通過改進的旋轉位置編碼和滑動窗口技術,顯著提升了在長上下文任務中的表現,同時保持了原模型的簡潔結構。

模型特點

長上下文處理
支持最高32K tokens的上下文長度,通過改進的旋轉位置編碼和滑動窗口技術優化長上下文處理能力。
性能提升
在多項長上下文檢索與問答任務中表現顯著提升,如主題檢索、行檢索等。
資源高效
可在單臺AWS g5.2x實例上部署,適合資源受限環境下的高性能需求。

模型能力

長上下文文本生成
主題檢索
行檢索
密鑰檢索
長文本問答
摘要生成

使用案例

信息檢索
主題檢索
在長文檔中檢索特定主題的信息
在2851至13780 tokens的測試中,準確率從98%到100%不等
行檢索
在長文檔中檢索特定行的信息
在3818至12657 tokens的測試中,準確率從60%到98%不等
問答系統
長文本問答
基於長文檔內容回答複雜問題
測試集準確率64.4%,困難子集準確率56.2%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase