Distilbert Base Es Multilingual Cased
これはdistilbert-base-multilingual-casedから抽出されたスペイン語サブセットモデルで、BERT基礎多言語モデルの蒸留バージョンです。パラメータ規模は小さいですが、主要な機能を保持しています。
ダウンロード数 76
リリース時間 : 3/2/2022
モデル概要
このモデルは、スペイン語で最も頻繁に使用される語彙素のみを選択することで、元の多言語モデルの規模を縮小し、埋め込み層のサイズを減らしています。スペイン語のテキスト処理タスクに適しています。
モデル特徴
軽量化設計
元のDistilmBERTの1.34億のパラメータと比較して、このモデルはわずか6300万のパラメータで、大幅にモデル規模を縮小しています。
スペイン語最適化
スペイン語で最も頻繁に使用される語彙素を選択することで、スペイン語のテキスト処理能力を特別に最適化しています。
大文字小文字を区別
大文字と小文字を区別できます。例えば、'english'と'English'は異なる語彙素として扱われます。
高効率推論
DistilBERTのバリエーションとして、高い推論効率を維持しています。
モデル能力
テキストマスク予測
スペイン語テキスト理解
文脈的な意味解析
使用事例
テキスト補完
文章補完
文章中の[MASK]位置の単語を予測する
例えば、「私の名前はフアンで、私は[MASK]に住んでいます。」と入力すると、正しい場所を予測できます。
言語理解
スペイン語テキスト分析
スペイン語テキストの意味を理解する
感情分析やトピック分類などの下流タスクに使用できます。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98