S

Simcse Model M Bert Thai Cased

由kornwtp開發
基於mBERT的SimCSE模型,專門針對泰語進行訓練,用於生成句子和段落的768維向量表示
下載量 25
發布時間 : 12/22/2023

模型概述

該模型採用SimCSE方法,以mBERT為基礎模型,利用泰語維基百科數據進行訓練,適用於句子相似度計算、聚類和語義搜索等任務

模型特點

泰語優化
專門針對泰語進行訓練,在泰語文本處理任務中表現優異
SimCSE訓練方法
採用對比學習框架SimCSE進行訓練,提升了句子表示的區分能力
多語言基礎
基於mBERT架構,保留了處理多語言文本的能力

模型能力

句子向量化
語義相似度計算
文本聚類
語義搜索

使用案例

信息檢索
泰語文檔相似性搜索
在泰語文檔庫中查找語義相似的文檔
文本分析
泰語文本聚類
對大量泰語文本進行自動分類和分組
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase