G

Gte Base Ko

由scottsuk0306開發
這是一個基於阿里巴巴NLP/gte-multilingual-base模型,在韓語三元組數據集上微調的sentence-transformers模型,用於語義文本相似度等任務。
下載量 18
發布時間 : 11/17/2024

模型概述

該模型將句子和段落映射到768維的密集向量空間,可用於語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務。

模型特點

多語言基礎模型
基於阿里巴巴NLP/gte-multilingual-base模型,具有良好的多語言處理能力
韓語優化
在韓語三元組數據集上進行了微調,特別適合韓語文本處理
高準確率
在開發集上達到0.9855的餘弦準確率
長文本支持
最大序列長度達8192個token,適合處理長文本

模型能力

語義文本相似度計算
語義搜索
文本特徵提取
文本聚類
文本分類

使用案例

信息檢索
相似文檔檢索
根據查詢文本查找語義相似的文檔
高準確率的相似度匹配
內容推薦
相關內容推薦
根據用戶瀏覽內容推薦語義相似的其他內容
提升用戶粘性和內容發現效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase