V

Vectorizer.vanilla

由sinequa開發
由Sinequa開發的向量化器,能夠根據輸入的段落或查詢生成嵌入向量,用於句子相似度計算和檢索任務。
下載量 634
發布時間 : 7/11/2023

模型概述

該模型是一個特徵提取模型,專門用於生成文本的嵌入向量。段落向量可存儲於向量索引中,查詢向量則用於檢索相關段落。

模型特點

高效推理
在多種GPU上均能實現毫秒級推理,最高批處理速度可達5毫秒(FP16量化)
多GPU支持
支持NVIDIA A10/T4/L4等多種GPU,並提供FP16/FP32兩種量化選項
魯棒性訓練
使用查詢-段落-負樣本三元組和批次內負樣本策略進行訓練,提升模型區分能力

模型能力

文本向量化
句子相似度計算
語義檢索

使用案例

信息檢索
文檔檢索系統
將文檔段落向量化存儲,通過查詢向量快速檢索相關內容
在BEIR基準測試14個數據集上平均Recall@100達0.639
問答系統
FAQ匹配
將用戶問題與知識庫問題進行向量相似度匹配
在Quora數據集上Recall@100達0.995
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase