Distilbert Base Es Multilingual Cased
這是從distilbert-base-multilingual-cased中提取的西班牙語子集模型,是BERT基礎多語言模型的蒸餾版本,參數規模更小但保留了主要功能。
下載量 76
發布時間 : 3/2/2022
模型概述
該模型通過僅選擇西班牙語最常用的詞元來縮小原多語言模型的規模,減少嵌入層大小,適用於西班牙語文本處理任務。
模型特點
輕量化設計
相比原DistilmBERT的1.34億參數,該模型僅6300萬參數,大幅減小了模型規模。
西班牙語優化
通過選擇西班牙語最常用的詞元,專門優化了西班牙語文本處理能力。
區分大小寫
能夠區分大小寫,如'english'和'English'會被視為不同詞元。
高效推理
作為DistilBERT的變體,保持了較高的推理效率。
模型能力
文本掩碼預測
西班牙語文本理解
上下文語義分析
使用案例
文本補全
句子補全
預測句子中[MASK]位置的單詞
如輸入'我的名字是胡安,我住在[MASK]。'可預測出正確的地點
語言理解
西班牙語文本分析
理解西班牙語文本的語義
可用於情感分析、主題分類等下游任務
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98