V

Vectorizer V1 S En

由sinequa開發
由Sinequa開發的向量化器,能夠根據段落或查詢生成嵌入向量,用於句子相似度計算和特徵提取。
下載量 304
發布時間 : 7/10/2023

模型概述

該模型能夠將段落或查詢轉換為嵌入向量,段落向量存儲在向量索引中,查詢向量用於查找索引中的相關段落。

模型特點

高效向量化
能夠快速將文本段落或查詢轉換為256維的嵌入向量
大小寫不敏感
對文本的大小寫和重音不敏感,提高匹配準確性
雙階段訓練
採用批內負樣本策略和ANCE變體的兩階段訓練過程,優化模型性能

模型能力

文本向量化
句子相似度計算
語義搜索

使用案例

信息檢索
文檔檢索
在文檔庫中查找與查詢最相關的段落
在BEIR基準測試中平均Recall@100達到0.456
問答系統
基於段落的問答
通過向量相似度匹配找到最可能包含答案的段落
在Natural Questions數據集上Recall@100達到0.671
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase