D

Distilcamembert Base

由cmarkea開發
DistilCamemBERT是法語CamemBERT模型的蒸餾版本,通過知識蒸餾技術顯著降低模型複雜度,同時保持性能。
下載量 15.79k
發布時間 : 3/2/2022

模型概述

該模型是法語RoBERTa模型CamemBERT的蒸餾版本,適用於多種自然語言處理任務,如文本分類、語義匹配等。

模型特點

知識蒸餾技術
通過蒸餾技術顯著降低模型複雜度,同時保持性能,損失函數包括蒸餾損失、餘弦損失和MLM損失。
高性能
在多個法語NLP任務上表現優異,如文本分類F1分數達83%,命名實體識別F1分數達98%。
輕量化
相比原始CamemBERT模型,蒸餾版模型更輕量,適合資源有限的環境。

模型能力

文本分類
語義匹配
自然語言推理
命名實體識別
掩碼填充

使用案例

文本處理
文本分類
對法語文本進行分類,如情感分析、主題分類等。
在FLUE數據集上F1分數達83%。
語義匹配
判斷兩個法語文本的語義相似性。
在FLUE數據集上F1分數達77%。
信息提取
命名實體識別
從法語文本中識別命名實體,如人名、地名等。
在wikiner_fr數據集上F1分數達98%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase