E

E5 Base Korean

由upskyy開發
這是一個基於multilingual-e5-base模型進行韓語優化的句子嵌入模型,支持多語言文本相似度計算和特徵提取。
下載量 53
發布時間 : 8/9/2024

模型概述

該模型將句子和段落映射到768維的密集向量空間,可用於語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務。

模型特點

多語言支持
支持100多種語言的文本嵌入,特別針對韓語進行了優化
高質量語義表示
在韓語語義相似度任務上表現出色,皮爾遜餘弦相似度達到0.859
長文本處理
最大序列長度支持512個標記,適合處理段落級文本

模型能力

語義文本相似度計算
語義搜索
文本分類
文本聚類
複述挖掘

使用案例

信息檢索
跨語言文檔檢索
在多語言文檔庫中查找語義相似的文檔
內容推薦
相似新聞推薦
根據用戶閱讀內容推薦語義相似的新聞文章
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase