L

Longformer Base 4096 Sentence Transformers All Nli Stsb Quora Nq

由Leo1212開發
這是一個基於allenai/longformer-base-4096微調的sentence-transformers模型,用於生成句子和段落的768維密集向量表示,適用於語義文本相似度、語義搜索等任務。
下載量 45
發布時間 : 4/25/2025

模型概述

該模型將句子和段落映射到768維密集向量空間,可用於語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務。

模型特點

長文本處理能力
基於Longformer架構,支持最長4098個token的序列長度,適合處理長文檔和段落。
多任務訓練
在多個數據集(all-nli、stsb、quora、natural-questions)上聯合訓練,增強了模型的泛化能力。
多損失函數優化
使用MultipleNegativesRankingLoss、SoftmaxLoss和CoSENTLoss等多種損失函數進行優化,提升不同任務的表現。

模型能力

語義文本相似度計算
語義搜索
複述挖掘
文本分類
文本聚類
特徵提取

使用案例

信息檢索
相似問題匹配
在問答系統中查找與用戶提問語義相似的問題
可準確匹配Quora等平臺上的重複問題
內容推薦
相關內容推薦
基於內容相似度推薦文章或產品
可提高用戶參與度和轉化率
文本分析
文本聚類
將大量文檔按語義相似度分組
可用於主題建模和文檔組織
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase