G

Gte En Mlm Base

由Alibaba-NLP開發
GTE-v1.5系列中的英語文本編碼器,基於BERT架構改進,支持長達8192的上下文長度,適用於英語文本表示任務。
下載量 231
發布時間 : 8/6/2024

模型概述

該模型是GTE-v1.5系列的英語文本編碼器,基於transformer++編碼器架構(BERT + RoPE + GLU),專為英語文本表示設計,支持長上下文處理。

模型特點

長上下文支持
支持長達8192的上下文長度,適合處理長文檔和複雜文本。
改進的架構
基於BERT架構改進,加入了RoPE和GLU,提升了模型性能。
分階段訓練
採用分階段訓練策略,先在短序列上預訓練,再在長序列上微調,優化長文本處理能力。

模型能力

文本編碼
長文本處理
掩碼語言建模

使用案例

信息檢索
文檔檢索
用於長文檔的檢索和匹配,提升檢索系統的準確性。
自然語言處理
文本表示
生成高質量的文本嵌入,用於下游NLP任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase