B

Bge M3 Korean

由upskyy開發
基於BAAI/bge-m3針對韓語優化的句子嵌入模型,支持1024維向量表示,適用於語義相似度計算等任務
下載量 7,823
發布時間 : 8/9/2024

模型概述

該模型是基於BAAI/bge-m3針對korsts和kornli數據集進行微調的韓語句子嵌入模型,可將文本映射到1024維向量空間,用於語義文本相似度、語義搜索、文本分類等任務

模型特點

優化的韓語理解
針對韓語數據集(korst和kornli)專門微調,在韓語語義理解任務上表現優異
長文本支持
最大支持8192個標記的序列長度,適合處理長文檔和段落
高質量嵌入
生成1024維的密集向量表示,在多種相似度指標上表現良好

模型能力

語義文本相似度計算
語義搜索
文本分類
聚類分析
複述挖掘

使用案例

信息檢索
相似文檔查找
在文檔庫中查找語義相似的文檔
皮爾遜餘弦相似度達到0.874
問答系統
問題匹配
匹配用戶問題與知識庫中的相似問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase