S

Simcse Model M Bert Thai Cased

Developed by mrp
基于mBERT的泰语句子嵌入模型,使用SimCSE方法在泰语维基百科数据上训练,可将文本映射为768维向量
Downloads 1,637
Release Time : 3/2/2022

Model Overview

该模型采用对比学习框架(SimCSE)微调mBERT,专门针对泰语文本生成语义嵌入向量,适用于句子相似度计算、语义搜索等任务

Model Features

泰语优化
专门针对泰语特性优化的句子嵌入模型
SimCSE框架
采用对比学习框架提升句子表示质量
高维语义空间
生成768维的密集向量表示

Model Capabilities

句子向量化
语义相似度计算
文本聚类
语义搜索

Use Cases

信息检索
泰语相似问题匹配
在问答系统中匹配语义相似的泰语问题
提高问答系统准确率
内容推荐
泰语新闻推荐
基于内容相似度的新闻文章推荐
提升用户阅读体验
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase