C

Cocom V1 4 Mistral 7b

由naver開發
COCOM 是一種高效的上下文壓縮方法,能夠將長上下文壓縮為少量上下文嵌入,從而加速問答任務的生成時間。
下載量 17
發布時間 : 10/14/2024

模型概述

COCOM 是一種用於檢索增強生成(RAG)的高效上下文壓縮方法,通過將長上下文壓縮為少量上下文嵌入來加速生成時間,支持不同的壓縮率以實現解碼時間和答案質量的權衡。

模型特點

高效的上下文壓縮
將長上下文壓縮為少量上下文嵌入,顯著減少解碼時間。
支持多上下文處理
能夠高效處理多個上下文,適用於複雜的問答場景。
可調節的壓縮率
支持不同的壓縮率,用戶可以在解碼時間和答案質量之間進行權衡。

模型能力

上下文壓縮
問答生成
檢索增強生成(RAG)

使用案例

信息檢索與問答
影視角色查詢
快速回答關於影視劇中角色扮演者的問題。
相比現有方法,最高實現5.69倍的加速。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase