distilbert-base-es-multilingual-casedオープンソースモデル - 実用的なスペイン語サブセット、少ないパラメータで大きな機能

ホーム

Distilbert Base Es Multilingual Cased

Recognaiによって開発

これはdistilbert-base-multilingual-casedから抽出されたスペイン語サブセットモデルで、BERT基礎多言語モデルの蒸留バージョンです。パラメータ規模は小さいですが、主要な機能を保持しています。

大規模言語モデル

Transformers

スペイン語オープンソースライセンス:Apache-2.0 #スペイン語NLP #蒸留モデル #多言語語彙素の削減

ダウンロード数 76

リリース時間 : 3/2/2022

モデル概要

このモデルは、スペイン語で最も頻繁に使用される語彙素のみを選択することで、元の多言語モデルの規模を縮小し、埋め込み層のサイズを減らしています。スペイン語のテキスト処理タスクに適しています。

モデル特徴

軽量化設計

元のDistilmBERTの1.34億のパラメータと比較して、このモデルはわずか6300万のパラメータで、大幅にモデル規模を縮小しています。

スペイン語最適化

スペイン語で最も頻繁に使用される語彙素を選択することで、スペイン語のテキスト処理能力を特別に最適化しています。

大文字小文字を区別

大文字と小文字を区別できます。例えば、'english'と'English'は異なる語彙素として扱われます。

高効率推論

DistilBERTのバリエーションとして、高い推論効率を維持しています。

モデル能力

テキストマスク予測

スペイン語テキスト理解

文脈的な意味解析

使用事例

テキスト補完

文章補完

文章中の[MASK]位置の単語を予測する

例えば、「私の名前はフアンで、私は[MASK]に住んでいます。」と入力すると、正しい場所を予測できます。

言語理解

スペイン語テキスト分析

スペイン語テキストの意味を理解する

感情分析やトピック分類などの下流タスクに使用できます。

🚀 DistilBERTベース多言語モデルのスペイン語サブセット（大文字小文字区別あり）

このモデルは、BERTベース多言語モデルの蒸留版である distilbert-base-multilingual-cased (https://huggingface.co/distilbert-base-multilingual-cased) のスペイン語抽出版です。このモデルは大文字小文字を区別します。つまり、"english" と "English" を区別します。

このモデルは、https://github.com/Geotrend-research/smaller-transformers に記載されているGeotrendによって提案された抽出方法を使用しています。

結果として得られるモデルは、DistilmBERTと同じアーキテクチャを持ちます。6層、768次元、12ヘッドで、合計6300万のパラメータ（DistilmBERTの1億3400万のパラメータと比較）です。

このモデルの目的は、スペイン語で最も頻繁に使用されるトークンのみを選択することで、distilbert-base-multilingual 多言語モデルのサイズをさらに縮小することです。詳細については、Geotrendチームの論文「Load What You Need: Smaller Versions of Multilingual BERT」を参照してください。

✨ 主な機能

スペイン語のみを対象としたモデルで、多言語モデルから最も頻繁に使用されるトークンを選択することでサイズを縮小。
大文字小文字を区別した表現が可能。

📦 インストール

原文書にインストール手順が記載されていないため、このセクションは省略されます。

💻 使用例

原文書にコード例が記載されていないため、このセクションは省略されます。

📚 ドキュメント

データセット

属性	详情
モデルタイプ	DistilBERTベース多言語モデルのスペイン語サブセット（大文字小文字区別あり）
学習データ	Wikipedia

ウィジェット

ウィジェットのテキスト例: "Mi nombre es Juan y vivo en [MASK]."

🔧 技術詳細

このモデルは、Geotrendによって提案された抽出方法を使用して、distilbert-base-multilingual-cased からスペイン語のみを抽出しています。抽出方法の詳細は、https://github.com/Geotrend-research/smaller-transformers を参照してください。

結果として得られるモデルは、DistilmBERTと同じアーキテクチャを持ち、6層、768次元、12ヘッドで、合計6300万のパラメータを持っています。