A

Albert Large Chinese Cluecorpussmall

由uer開發
基於UER-py框架預訓練的中文ALBERT模型,使用CLUECorpusSmall語料訓練,適用於中文文本處理任務。
下載量 17
發布時間 : 3/2/2022

模型概述

該模型是輕量級的ALBERT中文版本,主要用於中文文本的掩碼語言建模和特徵提取任務。

模型特點

輕量級設計
採用ALBERT架構,通過參數共享技術減少模型參數,保持性能的同時降低計算資源需求。
中文優化
專門針對中文文本進行預訓練,使用CLUECorpusSmall語料庫,適應中文語言特點。
多階段訓練
採用兩階段訓練策略,先以短序列訓練,再以長序列微調,提升模型性能。

模型能力

文本特徵提取
掩碼語言預測
中文文本理解

使用案例

文本補全
中文文本掩碼預測
預測被[MASK]標記的中文詞語
示例中'中國的首都是[MASK]京'預測為'北京',準確率85.28%
文本特徵提取
中文文本表示學習
獲取中文文本的向量表示
可用於下游任務如分類、聚類等
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase