E

Erlangshen SimCSE 110M Chinese

Developed by IDEA-CCNL
基于SimCSE无监督版本,采用中文NLI数据进行有监督对比学习训练的中文句子向量表征模型
Downloads 186
Release Time : 11/7/2022

Model Overview

该模型通过对比学习训练,可直接提取句向量进行相似度计算,无需微调即可用于中文句对匹配任务

Model Features

中文优化
专门针对中文语言特性进行优化训练
直接句向量提取
无需微调即可通过[CLS]标记输出进行相似度判定
对比学习训练
采用无监督与有监督结合的对比学习方法

Model Capabilities

中文句子向量表征
句子相似度计算
文本匹配

Use Cases

文本匹配
问答系统
用于匹配用户问题与知识库中的候选答案
提高问答准确率
语义搜索
增强搜索引擎对查询语句的理解能力
提升搜索结果相关性
自然语言理解
文本分类
作为文本分类任务的特征提取器
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase