D

Dse Qwen2 2b Mrl V1

由MrLight開發
DSE-QWen2-2b-MRL-V1 是一個雙編碼器模型,專為將文檔截圖編碼為密集向量以實現文檔檢索而設計。
下載量 4,447
發布時間 : 9/11/2024

模型概述

該模型採用文檔截圖嵌入(DSE)方法,以原始視覺格式捕獲文檔,保留所有信息(如文本、圖像和佈局),避免繁瑣的解析和潛在的信息丟失。旨在為文本、PDF文檔、網頁和幻燈片檢索提供通用的嵌入模型。

模型特點

原始視覺格式處理
直接處理文檔截圖,保留原始佈局、文本和圖像信息
靈活的表示維度
支持調整輸出嵌入維度以平衡效果與效率
靈活的輸入尺寸
可根據GPU資源調整輸入圖像尺寸
多語言支持
支持英文和法文文檔處理

模型能力

文檔截圖嵌入
密集向量檢索
跨模態文檔理解
多語言文檔處理

使用案例

文檔檢索
學術論文檢索
通過論文截圖檢索相關文獻
在ViDoRE排行榜上實現85.8的nDCG@5
企業文檔管理
快速檢索PDF、PPT等企業文檔
跨模態搜索
圖文混合檢索
同時處理文檔中的文本和視覺信息進行檢索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase