R

Roberta Base Word Chinese Cluecorpussmall

由uer開發
基於CLUECorpusSmall語料預訓練的中文分詞版RoBERTa中型模型,採用分詞處理提升序列處理效率
下載量 184
發布時間 : 3/2/2022

模型概述

該模型是中文分詞版本的RoBERTa預訓練模型,相比字級別模型具有更優性能和更快速度,適用於中文自然語言處理任務

模型特點

分詞優化
採用sentencepiece分詞技術,相比字級別模型縮短序列長度,提升處理速度
多規模選擇
提供從微型(Tiny)到基礎(Base)五種不同規模的預訓練模型
公開語料
基於公開的CLUECorpusSmall語料訓練,結果可復現

模型能力

文本特徵提取
掩碼語言預測
中文文本理解

使用案例

文本補全
交通信息補全
補全類似'去北京的[MASK]幾點發車'的交通查詢語句
可準確預測'航班'、'高鐵'等交通方式
文本特徵提取
文檔向量化
獲取中文文本的深度語義表示
可用於下游分類、聚類等任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase