C

Canine S

由google開發
CANINE-s是一種高效的無分詞多語言預訓練模型,直接在字符級別操作,支持104種語言。
下載量 46.51k
發布時間 : 3/2/2022

模型概述

CANINE-s是一種基於Transformer架構的預訓練模型,無需顯式分詞器,直接在Unicode字符級別處理文本。適用於多種自然語言處理任務。

模型特點

無分詞處理
直接在字符級別操作,無需顯式分詞器,簡化輸入處理流程。
多語言支持
在104種語言上預訓練,具有廣泛的語言適應性。
子詞損失預訓練
採用子詞損失訓練,在字符輸入基礎上預測子詞標記,形成軟歸納偏置。

模型能力

多語言文本理解
掩碼語言建模
下一句預測
序列分類
標記分類
問答任務

使用案例

自然語言處理
文本分類
對多語言文本進行分類任務
命名實體識別
識別文本中的命名實體
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase