bge-m3-onnx-o4开源模型 - 免费支持多类型检索，覆盖超100种语言

首页

Bge M3 Onnx O4

由 hooman650 开发

这是BAAI/bge-m3模型的ONNX量化版本，支持稠密检索、多向量检索和稀疏检索三种功能，覆盖100多种语言。

文本嵌入

Transformers

开源协议:MIT #多语言检索 #多粒度处理 #稠密稀疏双模

下载量 285.96k

发布时间 : 2/6/2024

模型简介

bge-m3-onnx-o4是BAAI/bge-m3模型的ONNX量化版本，具有多功能检索能力，支持多语言和多粒度文本处理。

模型特点

多功能检索

同时支持稠密检索、多向量检索和稀疏检索三种功能

多语言支持

覆盖超过100种工作语言

多粒度处理

能够处理从短句到最长8192个token的文档

ONNX量化

使用ONNX格式进行优化，支持高效推理

模型能力

稠密检索

多向量检索

稀疏检索

多语言文本处理

长文档处理

使用案例

信息检索

跨语言文档检索

在多语言文档库中检索相关内容

可准确匹配不同语言的相似内容

长文档语义搜索

对长文档进行语义级别的搜索

支持最长8192个token的文档处理

自然语言处理

多语言文本嵌入

为不同语言的文本生成嵌入向量

支持100多种语言的文本表示

🚀 bge-m3-onnx-o4

bge-m3-onnx-o4 是原始模型 BAAI/bge-m3 的权重。这个模型为何如此出色呢？

[x] 多功能性：它能够同时实现嵌入模型常见的三种检索功能，即密集检索、多向量检索和稀疏检索。
[x] 多语言支持：它支持超过 100 种工作语言。
[x] 多粒度处理：它能够处理不同粒度的输入，从短句到长达 8192 个标记的长文档均可处理。

🚀 快速开始

✨ 主要特性

此模型具备多功能性、多语言支持和多粒度处理的特性，能够满足不同场景下的检索需求。

📦 安装指南

重要提示 - 下载模型权重

请参考以下说明。

下载检查点：由于某些原因，你无法直接从这个在线版本加载模型（会抛出异常）。请按如下方式下载此仓库：

# pip install huggingface-hub
 
from huggingface_hub import snapshot_download

snapshot_download(repo_id="hooman650/bge-m3-onnx-o4",local_dir="bge-m3-onnx")

💻 使用示例

基础用法

密集检索

# 安装依赖
# for cuda 
pip install --upgrade-strategy eager optimum[onnxruntime]

# 代码示例
from optimum.onnxruntime import ORTModelForFeatureExtraction
from transformers import AutoTokenizer
import torch

# Make sure that you download the model weights locally to `bge-m3-onnx`
model = ORTModelForFeatureExtraction.from_pretrained("bge-m3-onnx", provider="CUDAExecutionProvider") # omit provider for CPU usage.
tokenizer = AutoTokenizer.from_pretrained("hooman650/bge-m3-onnx-o4")

sentences = [
    "English: The quick brown fox jumps over the lazy dog.",
    "Spanish: El rápido zorro marrón salta sobre el perro perezoso.",
    "French: Le renard brun rapide saute par-dessus le chien paresseux.",
    "German: Der schnelle braune Fuchs springt über den faulen Hund.",
    "Italian: La volpe marrone veloce salta sopra il cane pigro.",
    "Japanese: 速い茶色の狐が怠惰な犬を飛び越える。",
    "Chinese (Simplified): 快速的棕色狐狸跳过懒狗。",
    "Russian: Быстрая коричневая лиса прыгает через ленивую собаку.",
    "Arabic: الثعلب البني السريع يقفز فوق الكلب الكسول.",
    "Hindi: तेज़ भूरी लोमड़ी आलसी कुत्ते के ऊपर कूद जाती है।"
]

encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt').to("cuda")

# Get the embeddings
out=model(**encoded_input,return_dict=True).last_hidden_state

# normalize the embeddings
dense_vecs = torch.nn.functional.normalize(out[:, 0], dim=-1)