B

BGE M3 Ko

由dragonkue開發
基於BAAI/bge-m3優化的韓英語雙語句子嵌入模型,支持語義文本相似度、信息檢索等任務
下載量 29.78k
發布時間 : 9/17/2024

模型概述

這是一個基於sentence-transformers框架訓練的模型,專門針對韓語和英語進行了優化。它將句子和段落映射到1024維稠密向量空間,可用於語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務。

模型特點

韓語優化
在標準BGE-M3基礎上針對韓語進行了專門訓練和優化
長文本支持
支持最大8192個標記的序列長度,適合處理較長文本
高性能檢索
在韓語嵌入基準測試中表現出色,Top-1 F1得分達0.7456
多相似度計算
支持餘弦相似度和點積相似度兩種計算方式

模型能力

語義文本相似度計算
信息檢索
文本特徵提取
文本分類
文本聚類
複述挖掘

使用案例

信息檢索
韓語文檔檢索
根據查詢語句從韓語文檔庫中檢索最相關的文檔
在Top-1檢索中達到0.7456的F1分數
文本相似度
相似問題匹配
識別不同表述但語義相似的問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase