K

KR SBERT Medium Extended Patent2024 Hn

由snunlp開發
這是一個從snunlp/KR-Medium-extended微調而來的sentence-transformers模型,專門用於處理韓語專利文本的句子相似度任務。
下載量 773
發布時間 : 8/27/2024

模型概述

該模型將句子和段落映射到768維密集向量空間,可用於語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務。

模型特點

專利文本優化
專門針對韓語專利文本進行優化,能夠更好地處理技術性強的專利內容。
高維向量表示
將文本映射到768維密集向量空間,捕捉豐富的語義信息。
大規模訓練
在包含1,795,000個訓練樣本的korpat-triplet數據集上進行訓練。

模型能力

計算句子相似度
語義搜索
複述挖掘
文本分類
文本聚類

使用案例

專利分析
專利相似性檢索
查找與給定專利描述相似的其他專利
提高專利檢索效率和準確性
專利分類
根據專利內容自動分類到不同技術領域
簡化專利管理流程
技術文檔處理
技術文檔去重
識別內容相似的技術文檔
減少重複文檔存儲
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase