D

Distilbert Base Indonesian

由cahya開發
這是印尼語BERT基礎模型的蒸餾版本,專為印尼語處理設計,採用無大小寫格式。
下載量 1,815
發布時間 : 3/2/2022

模型概述

該模型是基於印尼語數據集預訓練的語言模型,適用於文本分類、文本生成等下游任務。

模型特點

蒸餾模型
基於印尼語BERT基礎模型的蒸餾版本,保留了大部分性能但模型更輕量。
無大小寫處理
所有輸入文本均經過小寫處理,簡化了文本預處理步驟。
印尼語優化
專門針對印尼語進行預訓練,適合印尼語文本處理任務。

模型能力

掩碼語言建模
文本特徵提取
文本分類
文本生成

使用案例

文本處理
填充掩碼
預測句子中被掩碼的詞語
如示例所示,能準確預測印尼語語境中的合適詞語
文本特徵提取
獲取文本的向量表示
可用於下游任務如分類或相似度計算
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase