A

Arabic All Nli Triplet Matryoshka

由Omartificial-Intelligence-Space開發
基於sentence-transformers/paraphrase-multilingual-mpnet-base-v2微調的阿拉伯語句子相似度模型,支持特徵提取和訓練生成
下載量 2,523
發布時間 : 6/14/2024

模型概述

該模型專門針對阿拉伯語優化,用於計算句子相似度和特徵提取任務,採用MatryoshkaLoss和MultipleNegativesRankingLoss聯合訓練

模型特點

多語言基礎模型微調
基於強大的多語言模型paraphrase-multilingual-mpnet-base-v2進行阿拉伯語專項優化
雙重損失函數
結合MatryoshkaLoss和MultipleNegativesRankingLoss進行聯合訓練,提升模型性能
大規模訓練數據
使用557,850條阿拉伯語NLI三元組數據進行訓練
多維評估指標
支持皮爾遜和斯皮爾曼相關係數的多種距離度量評估

模型能力

阿拉伯語句子相似度計算
句子特徵提取
文本語義匹配
跨語言文本檢索

使用案例

信息檢索
阿拉伯語文檔檢索
用於阿拉伯語搜索引擎中的相關文檔檢索
在MIRACL阿拉伯語檢索任務中NDCG@10達到26.274
文本匹配
問答系統
匹配用戶問題與知識庫中的最佳答案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase