B

Bert Base 1024 Biencoder 6M Pairs

由shreyansh26開發
基於MosaicML預訓練的1024序列長度BERT的長上下文雙編碼器,用於生成句子和段落的768維密集向量表示
下載量 24
發布時間 : 8/17/2023

模型概述

該模型將句子和段落映射到768維密集向量空間,可用於聚類或語義搜索等任務。支持1024的序列長度,基於6.4M句子/段落對訓練。

模型特點

長上下文支持
支持1024的序列長度,適合處理長文本
高效雙編碼器
採用雙編碼器架構,可高效生成句子和段落的向量表示
大規模訓練數據
基於6.4M隨機採樣的句子/段落對訓練

模型能力

句子向量化
段落向量化
語義相似度計算
文本聚類
語義搜索

使用案例

信息檢索
文檔檢索
使用向量相似度進行文檔檢索
在多個檢索基準測試中表現良好
問答系統
用於問答系統中的段落檢索
文本分析
文本聚類
基於語義相似度的文本聚類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase