bge-m3-onnx-o4開源模型 - 免費支持多類型檢索，覆蓋超100種語言

首頁

Bge M3 Onnx O4

由hooman650開發

這是BAAI/bge-m3模型的ONNX量化版本，支持稠密檢索、多向量檢索和稀疏檢索三種功能，覆蓋100多種語言。

文本嵌入

Transformers

開源協議:MIT #多語言檢索 #多粒度處理 #稠密稀疏雙模

下載量 285.96k

發布時間 : 2/6/2024

模型概述

bge-m3-onnx-o4是BAAI/bge-m3模型的ONNX量化版本，具有多功能檢索能力，支持多語言和多粒度文本處理。

模型特點

多功能檢索

同時支持稠密檢索、多向量檢索和稀疏檢索三種功能

多語言支持

覆蓋超過100種工作語言

多粒度處理

能夠處理從短句到最長8192個token的文檔

ONNX量化

使用ONNX格式進行優化，支持高效推理

模型能力

稠密檢索

多向量檢索

稀疏檢索

多語言文本處理

長文檔處理

使用案例

信息檢索

跨語言文檔檢索

在多語言文檔庫中檢索相關內容

可準確匹配不同語言的相似內容

長文檔語義搜索

對長文檔進行語義級別的搜索

支持最長8192個token的文檔處理

自然語言處理

多語言文本嵌入

為不同語言的文本生成嵌入向量

支持100多種語言的文本表示

🚀 bge-m3-onnx-o4

bge-m3-onnx-o4 是原始模型 BAAI/bge-m3 的權重。這個模型為何如此出色呢？

[x] 多功能性：它能夠同時實現嵌入模型常見的三種檢索功能，即密集檢索、多向量檢索和稀疏檢索。
[x] 多語言支持：它支持超過 100 種工作語言。
[x] 多粒度處理：它能夠處理不同粒度的輸入，從短句到長達 8192 個標記的長文檔均可處理。

🚀 快速開始

✨ 主要特性

此模型具備多功能性、多語言支持和多粒度處理的特性，能夠滿足不同場景下的檢索需求。

📦 安裝指南

重要提示 - 下載模型權重

請參考以下說明。

下載檢查點：由於某些原因，你無法直接從這個在線版本加載模型（會拋出異常）。請按如下方式下載此倉庫：

# pip install huggingface-hub
 
from huggingface_hub import snapshot_download

snapshot_download(repo_id="hooman650/bge-m3-onnx-o4",local_dir="bge-m3-onnx")

💻 使用示例

基礎用法

密集檢索

# 安裝依賴
# for cuda 
pip install --upgrade-strategy eager optimum[onnxruntime]

# 代碼示例
from optimum.onnxruntime import ORTModelForFeatureExtraction
from transformers import AutoTokenizer
import torch

# Make sure that you download the model weights locally to `bge-m3-onnx`
model = ORTModelForFeatureExtraction.from_pretrained("bge-m3-onnx", provider="CUDAExecutionProvider") # omit provider for CPU usage.
tokenizer = AutoTokenizer.from_pretrained("hooman650/bge-m3-onnx-o4")

sentences = [
    "English: The quick brown fox jumps over the lazy dog.",
    "Spanish: El rápido zorro marrón salta sobre el perro perezoso.",
    "French: Le renard brun rapide saute par-dessus le chien paresseux.",
    "German: Der schnelle braune Fuchs springt über den faulen Hund.",
    "Italian: La volpe marrone veloce salta sopra il cane pigro.",
    "Japanese: 速い茶色の狐が怠惰な犬を飛び越える。",
    "Chinese (Simplified): 快速的棕色狐狸跳過懶狗。",
    "Russian: Быстрая коричневая лиса прыгает через ленивую собаку.",
    "Arabic: الثعلب البني السريع يقفز فوق الكلب الكسول.",
    "Hindi: तेज़ भूरी लोमड़ी आलसी कुत्ते के ऊपर कूद जाती है।"
]

encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt').to("cuda")

# Get the embeddings
out=model(**encoded_input,return_dict=True).last_hidden_state

# normalize the embeddings
dense_vecs = torch.nn.functional.normalize(out[:, 0], dim=-1)