J

Jina Embeddings V4

由jinaai開發
Jina Embeddings v4 是一款專為多模態和多語言檢索設計的通用嵌入模型,特別適用於複雜文檔的檢索,包括包含圖表、表格和插圖的視覺豐富文檔。
下載量 669
發布時間 : 5/7/2025

模型概述

基於 Qwen/Qwen2.5-VL-3B-Instruct 構建,支持文本、圖像和視覺文檔的統一嵌入,同時支持密集和後期交互檢索。

模型特點

統一嵌入
支持文本、圖像和視覺文檔的統一嵌入,同時支持密集(單向量)和後期交互(多向量)檢索。
多語言支持
支持 30 多種語言,並與廣泛的領域兼容,包括技術和視覺複雜的文檔。
特定任務適配器
提供用於檢索、文本匹配和代碼相關任務的特定任務適配器,可在推理時選擇。
靈活的嵌入大小
默認情況下,密集嵌入為 2048 維,但可以截斷至低至 128 維,性能損失極小。

模型能力

多模態檢索
多語言文本嵌入
圖像嵌入
視覺文檔檢索
代碼理解

使用案例

信息檢索
跨語言文檔檢索
支持多種語言的文檔檢索,包括視覺豐富的文檔。
高效檢索多語言文檔
視覺文檔檢索
檢索包含圖表、表格和插圖的複雜文檔。
精準匹配視覺內容
文本匹配
多語言文本相似度計算
計算不同語言文本之間的相似度。
高準確度的跨語言匹配
代碼理解
代碼檢索
根據自然語言描述檢索相關代碼片段。
高效代碼搜索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase