A

Amber Large

由retrieva-jp開發
基於 modernbert-ja-310m 的日英雙語句子特徵提取模型,支持句子相似度計算和文本分類任務
下載量 239.28k
發布時間 : 3/7/2025

模型概述

該模型專注於日英雙語場景下的句子嵌入表示,可用於句子相似度計算、文本分類和聚類任務。基於 MTEB 基準測試顯示其在分類和聚類任務上表現良好。

模型特點

日英雙語支持
專門針對日語和英語雙語場景優化,可處理兩種語言的句子嵌入表示
多任務適配
支持分類、聚類和檢索等多種自然語言處理任務
MTEB 基準驗證
在多個 MTEB 基準測試中表現良好,特別是在分類任務上準確率達到 73.34%

模型能力

句子特徵提取
句子相似度計算
文本分類
文本聚類
跨語言文本處理

使用案例

電子商務
產品評論分類
對亞馬遜等電商平臺的用戶評論進行分類
在亞馬遜反事實分類任務中達到 73.34% 準確率
學術研究
論文聚類
對 arXiv 學術論文進行層次聚類
在 arXiv 論文聚類任務中 V-measure 達到 53.39
信息檢索
論點檢索
在辯論場景中檢索相關論點
在 ArguAna 任務中 NDCG@10 達到 51.32
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase