G

Gte Multilingual Reranker Base Onnx Op14 Opt Gpu Int8

由JustJaro開發
這是Alibaba-NLP/gte-multilingual-reranker-base的量化ONNX版本,採用INT8量化,針對GPU優化,適用於文本分類任務。
下載量 91
發布時間 : 3/27/2025

模型概述

本模型是基於Alibaba-NLP/gte-multilingual-reranker-base的量化ONNX版本,採用ONNX操作集14,適用於GPU設備,主要用於文本分類和句子相似度任務。

模型特點

INT8量化
採用INT8量化技術,顯著提升推理速度。
GPU優化
針對GPU設備進行了專門優化,提高計算效率。
多語言支持
支持多種語言的文本處理任務。
ONNX運行時
使用ONNX運行時框架,提供高效的模型推理能力。

模型能力

文本分類
句子相似度計算
多語言文本處理

使用案例

信息檢索
文檔重排序
在信息檢索系統中對搜索結果進行重排序,提高相關性。
提升檢索結果的準確性和相關性
文本分析
文本分類
對文本進行分類,適用於情感分析、主題分類等任務。
高效準確的文本分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase