R

Ruri Small

由cl-nagoya開發
Ruri是一個專注於日語文本嵌入的模型,能夠高效計算句子相似度和提取文本特徵。
下載量 11.75k
發布時間 : 8/28/2024

模型概述

該模型是一個日語通用文本嵌入模型,主要用於句子相似度計算和特徵提取。基於DistilBert架構,支持512個標記的最大序列長度,輸出維度為768。

模型特點

高效日語處理
專門針對日語文本優化,能準確理解日語語義特徵
高性能
在JMTEB評估中表現優異,超越同類模型
輕量化
僅68M參數的小型模型,適合資源有限的環境
長文本支持
支持最大512個標記的序列長度

模型能力

日語文本特徵提取
句子相似度計算
語義搜索
文本聚類

使用案例

信息檢索
語義搜索
根據查詢語義查找相關文檔
在JMTEB檢索任務中獲得69.41分
文本分析
文本聚類
將語義相似的文本分組
在JMTEB聚類任務中獲得51.19分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase