L

Lodestone Base 4096 V1

由Hum-Works開發
由Hum開發的sentence-transformers模型,支持4096 tokens長文本嵌入,適用於語義搜索和聚類任務
下載量 132
發布時間 : 8/25/2023

模型概述

基於Transformer架構創新的長文本編碼器,融合FlashAttention、ALiBi和GLU技術,可將句子和段落映射到768維向量空間

模型特點

超長上下文支持
通過ALiBi技術擴展至4096 tokens輸入長度,適合處理長文檔
高效注意力機制
集成FlashAttention優化計算效率,支持自動調用Triton高性能實現
輕量級設計
可在GPU/CPU上運行,平衡性能與資源消耗
多源訓練數據
基於15億句對的多領域數據(學術、問答、社區討論等)微調

模型能力

文本向量化
語義相似度計算
信息檢索
文本聚類

使用案例

知識管理
學術文獻檢索
基於S2ORC數據訓練的嵌入可用於論文推薦系統
社區內容處理
問答對匹配
識別StackExchange等平臺上的相似問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase