R

Ruri Base

由cl-nagoya開發
Ruri是一個針對日語的通用文本嵌入模型,專注於句子相似度和特徵提取任務。
下載量 523.56k
發布時間 : 8/28/2024

模型概述

Ruri是一個基於BERT架構的日語文本嵌入模型,主要用於計算句子相似度和提取文本特徵。模型支持在查詢和段落文本前添加特定前綴以獲得更好的效果。

模型特點

日語優化
專門針對日語文本進行優化,在日語任務上表現優異
長文本支持
最大序列長度達512個標記,能處理較長文本
高性能
在JMTEB基準測試中表現優於同類日語模型
前綴增強
支持通過添加查詢/文章前綴提升相似度計算效果

模型能力

句子相似度計算
文本特徵提取
語義搜索
文本聚類
信息檢索

使用案例

信息檢索
問答系統
通過計算查詢與候選答案的相似度實現問答功能
在JMTEB檢索任務上得分69.82
文本分析
文本聚類
對相似文本進行自動分組
在JMTEB聚類任務上得分54.16
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase