T

Text2vec Base Chinese

由shibing624開發
基於CoSENT(餘弦句子)模型的中文文本嵌入模型,可將句子映射到768維稠密向量空間,適用於句子嵌入、文本匹配或語義搜索等任務。
下載量 605.98k
發布時間 : 3/2/2022

模型概述

該模型採用CoSENT方法訓練,基於hfl/chinese-macbert-base在中文STS-B數據訓練得到,在中文STS-B測試集評估表現優異。

模型特點

高效中文語義匹配
在中文文本匹配任務中表現優異,適用於通用語義匹配場景。
基於CoSENT方法
採用餘弦句子(CoSENT)方法訓練,優化句子嵌入的相似度計算。
768維稠密向量
將句子映射到768維稠密向量空間,適合下游任務處理。

模型能力

句子嵌入
文本匹配
語義搜索

使用案例

文本相似度計算
問答系統
用於計算問題與候選答案的語義相似度
提升問答匹配準確率
信息檢索
增強搜索引擎的語義理解能力
提高搜索結果相關性
自然語言處理
文本聚類
用於相似文本的自動聚類
文本分類
作為文本分類任務的輸入特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase