G

Granite Vision 3.3 2b Embedding

由ibm-granite開發
基於granite-vision-3.3-2b構建的高效嵌入模型,專為多模態文檔檢索設計,可處理包含表格、圖表、信息圖和複雜佈局的文檔。
下載量 205
發布時間 : 6/3/2025

模型概述

該模型生成ColBERT風格的多向量頁面表示,無需基於OCR的文本提取,可簡化和加速RAG管道。

模型特點

多模態文檔處理
能夠處理包含表格、圖表、信息圖和複雜佈局的文檔
ColBERT風格表示
生成頁面的ColBERT風格多向量表示,提高檢索效率
無OCR需求
無需基於OCR的文本提取,簡化RAG管道
高效檢索
專為加速多模態文檔檢索而優化

模型能力

多模態文檔嵌入
圖像-文本相似度計算
複雜佈局文檔處理
跨模態檢索

使用案例

文檔檢索
財務報告檢索
從包含表格和圖表的財務報告中檢索相關信息
在FinReport數據集上NDCG@5達到70
技術文檔檢索
從技術報告和幻燈片中檢索特定信息
在TechReport和TechSlides數據集上NDCG@5分別達到84和93
跨模態搜索
圖像-文本匹配
計算圖像與文本描述的相似度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase