F

Financial Rag Matryoshka

由rbhatia46開發
基於Alibaba-NLP/gte-large-en-v1.5微調的金融專用句子轉換器模型,專注於金融文檔檢索任務
下載量 17.08k
發布時間 : 7/8/2024

模型概述

該模型能將句子和段落映射到1024維密集向量空間,可用於語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務,特別優化了金融領域的表現

模型特點

金融領域優化
在保持通用性能的同時,特別針對金融文檔檢索任務進行了優化
高維向量空間
能將文本映射到1024維密集向量空間,捕捉豐富的語義信息
長文本處理
支持最大8192個token的序列長度,適合處理長文檔
Matryoshka損失函數
使用MatryoshkaLoss配合MultipleNegativesRankingLoss進行訓練,提升模型性能

模型能力

語義文本相似度計算
語義搜索
複述挖掘
文本分類
文本聚類
金融文檔檢索

使用案例

金融信息檢索
金融機構報告檢索
快速檢索金融機構報告中的關鍵信息
在金融文檔檢索任務中表現出色
金融問答系統
構建基於語義匹配的金融問答系統
高準確率的語義匹配能力
通用文本處理
文檔相似度計算
計算不同文檔之間的語義相似度
文本聚類
對大量文本進行自動分類和聚類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase