J

Jina Embeddings V4

由 jinaai 开发
Jina Embeddings v4 是一款专为多模态和多语言检索设计的通用嵌入模型,特别适用于复杂文档的检索,包括包含图表、表格和插图的视觉丰富文档。
下载量 669
发布时间 : 5/7/2025

模型简介

基于 Qwen/Qwen2.5-VL-3B-Instruct 构建,支持文本、图像和视觉文档的统一嵌入,同时支持密集和后期交互检索。

模型特点

统一嵌入
支持文本、图像和视觉文档的统一嵌入,同时支持密集(单向量)和后期交互(多向量)检索。
多语言支持
支持 30 多种语言,并与广泛的领域兼容,包括技术和视觉复杂的文档。
特定任务适配器
提供用于检索、文本匹配和代码相关任务的特定任务适配器,可在推理时选择。
灵活的嵌入大小
默认情况下,密集嵌入为 2048 维,但可以截断至低至 128 维,性能损失极小。

模型能力

多模态检索
多语言文本嵌入
图像嵌入
视觉文档检索
代码理解

使用案例

信息检索
跨语言文档检索
支持多种语言的文档检索,包括视觉丰富的文档。
高效检索多语言文档
视觉文档检索
检索包含图表、表格和插图的复杂文档。
精准匹配视觉内容
文本匹配
多语言文本相似度计算
计算不同语言文本之间的相似度。
高准确度的跨语言匹配
代码理解
代码检索
根据自然语言描述检索相关代码片段。
高效代码搜索
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase