B

Bert Base 1024 Biencoder 64M Pairs

由shreyansh26開發
基於MosaicML預訓練的1024序列長度BERT的長上下文雙編碼器,用於句子和段落嵌入
下載量 19
發布時間 : 8/22/2023

模型概述

該模型將句子和段落映射到768維密集向量空間,可用於聚類或語義搜索等任務。

模型特點

長上下文支持
支持1024序列長度,適合處理長文檔和段落
大規模訓練
在64M隨機採樣的句子/段落對上進行了訓練
高效檢索
專為語義搜索和信息檢索任務優化

模型能力

句子嵌入
段落嵌入
語義相似度計算
信息檢索
文檔聚類

使用案例

信息檢索
語義搜索
構建搜索引擎的語義檢索功能
在多個檢索基準測試中表現良好
問答系統
用於檢索與問題最相關的文檔段落
文本分析
文檔聚類
將相似內容的文檔分組
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase