C

Cocom V1 128 Mistral 7b

由naver開發
COCOM是一種高效的上下文壓縮方法,能將長上下文壓縮為少量上下文嵌入,顯著加速問答任務的生成時間。
下載量 53
發布時間 : 10/15/2024

模型概述

COCOM是一種用於檢索增強生成(RAG)的上下文壓縮方法,通過將長上下文壓縮為少量上下文嵌入來提升生成速度,支持不同壓縮率以實現解碼時間和答案質量的靈活權衡。

模型特點

高效上下文壓縮
將長上下文壓縮為少量上下文嵌入,顯著減少解碼時間。
靈活壓縮率
支持不同壓縮率,可在解碼時間和答案質量之間靈活權衡。
多上下文處理
能高效處理多上下文場景,大幅降低長輸入的解碼耗時。

模型能力

上下文壓縮
問答生成
檢索增強生成

使用案例

信息檢索與問答
影視人物問答
基於多段上下文信息快速生成準確答案。
在保持高性能的同時,速度提升最高達5.69倍。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase