MalayuBERTオープンソースマレー語言モデル - 無料で利用可能、複数のフレームワークに対応したテキスト処理

ホーム

Melayubert

StevenLimcornによって開発

BERTアーキテクチャに基づくマレー語のマスク言語モデルで、OSCARデータセットのマレー語サブセットを使用して訓練され、PyTorchとTensorFlowフレームワークをサポートします。

大規模言語モデル

Transformers

その他オープンソースライセンス:MIT #マレー語のマスク予測 #複数フレームワーク対応 #低困惑度

ダウンロード数 15

リリース時間 : 3/2/2022

モデル概要

このモデルは、マレー語に特化したマスク言語モデルで、BERTアーキテクチャに基づいて開発され、主にマレー語テキストのマスク予測タスクを処理するために使用されます。

モデル特徴

BERTアーキテクチャに基づく

古典的なBERTアーキテクチャを採用し、マレー語テキストを処理する際に強力な性能を発揮します。

OSCARデータセットを使用して訓練

モデルはOSCARデータセットのマレー語サブセットを使用して訓練され、データの多様性と広範性が保証されます。

PyTorchとTensorFlowをサポート

モデルは2つの主要なディープラーニングフレームワークと互換性があり、ユーザーが異なる環境で使用するのを容易にします。

モデル能力

マスク言語予測

マレー語テキスト処理

使用事例

自然言語処理

マレー語テキストの補完

マレー語テキストのマスク部分を予測して補完するために使用されます。

検証セットで9.46の困惑度指標を達成しました。

🚀 メラヤ語BERT

メラヤ語BERTは、BERTに基づくマスク言語モデルです。このモデルは、OSCARデータセット、具体的にはunshuffled_original_msサブセットを使用して学習されました。使用されたモデルは英語のBERTモデルで、マレーシアのデータセットでファインチューニングされました。このモデルは、20%の検証データセットで9.46のパープレキシティを達成しました。多くの手法は、Sylvain GuggerによるHugging Faceのチュートリアルノートブックと、Pierre Guillouによるファインチューニングチュートリアルノートブックに基づいています。このモデルは、PyTorchとTensorFlowの両方で使用できます。

✨ 主な機能

メラヤ語に特化したマスク言語モデルで、メラヤ語の自然言語処理タスクに役立ちます。
英語のBERTモデルをベースにマレーシアのデータセットでファインチューニングされています。
PyTorchとTensorFlowの両方で使用可能です。

📦 インストール

このモデルを使用するには、transformersライブラリが必要です。以下のコマンドでインストールできます。

pip install transformers

📚 ドキュメント

モデル

このモデルは、学習率2e-3で3エポック学習され、以下のようなステップごとの学習損失を達成しました。

ステップ	学習損失
500	5.051300
1000	3.701700
1500	3.288600
2000	3.024000
2500	2.833500
3000	2.741600
3500	2.637900
4000	2.547900
4500	2.451500
5000	2.409600
5500	2.388300
6000	2.351600

モデル情報

属性	詳情
モデルタイプ	マスク言語モデル
学習データ	OSCARデータセットの`unshuffled_original_ms`サブセット

💻 使用例

基本的な使用法

マスク言語モデルとして使用

from transformers import pipeline
pretrained_name = "StevenLimcorn/MelayuBERT"
fill_mask = pipeline(
    "fill-mask",
    model=pretrained_name,
    tokenizer=pretrained_name
)
fill_mask("Saya [MASK] makan nasi hari ini.")

トークナイザーとモデルのインポート

from transformers import AutoTokenizer, AutoModelForMaskedLM
  
tokenizer = AutoTokenizer.from_pretrained("StevenLimcorn/MelayuBERT")

model = AutoModelForMaskedLM.from_pretrained("StevenLimcorn/MelayuBERT")