🚀 bert-base-multilingual-cased-finetuned-hausa
bert-base-multilingual-cased-finetuned-hausaは、ハウサ語のテキストでbert-base-multilingual-casedモデルをファインチューニングすることで得られたハウサ語BERTモデルです。 このモデルは、テキスト分類や固有表現認識のデータセットにおいて、多言語BERTよりも優れた性能を発揮します。
🚀 クイックスタート
このモデルは、マスクされたトークンの予測にTransformersのpipelineを使用して利用することができます。
✨ 主な機能
このモデルは、ハウサ語のコーパスでファインチューニングされたbert-base-multilingual-casedモデルです。テキスト分類や固有表現認識のタスクにおいて、多言語BERTよりも良い性能を提供します。
💻 使用例
基本的な使用法
>>> from transformers import pipeline
>>> unmasker = pipeline('fill-mask', model='Davlan/bert-base-multilingual-cased-finetuned-hausa')
>>> unmasker("Shugaban [MASK] Muhammadu Buhari ya amince da shawarar da ma’aikatar sufuri karkashin jagoranci")
[{'sequence':
'[CLS] Shugaban Nigeria Muhammadu Buhari ya amince da shawarar da ma [UNK] aikatar sufuri karkashin jagoranci [SEP]',
'score': 0.9762618541717529,
'token': 22045,
'token_str': 'Nigeria'},
{'sequence': '[CLS] Shugaban Ka Muhammadu Buhari ya amince da shawarar da ma [UNK] aikatar sufuri karkashin jagoranci [SEP]', 'score': 0.007239189930260181,
'token': 25444,
'token_str': 'Ka'},
{'sequence': '[CLS] Shugaban, Muhammadu Buhari ya amince da shawarar da ma [UNK] aikatar sufuri karkashin jagoranci [SEP]', 'score': 0.001990817254409194,
'token': 117,
'token_str': ','},
{'sequence': '[CLS] Shugaban Ghana Muhammadu Buhari ya amince da shawarar da ma [UNK] aikatar sufuri karkashin jagoranci [SEP]', 'score': 0.001566368737258017,
'token': 28682,
'token_str': 'Ghana'},
{'sequence': '[CLS] Shugabanmu Muhammadu Buhari ya amince da shawarar da ma [UNK] aikatar sufuri karkashin jagoranci [SEP]', 'score': 0.0009375187801197171,
'token': 11717,
'token_str': '##mu'}]
🔧 技術詳細
学習データ
このモデルは、Hausa CC - 100 でファインチューニングされました。
学習手順
このモデルは、単一のNVIDIA V100 GPUで学習されました。
評価結果
以下は、テストセットでの評価結果(F値、5回の実行の平均)です。
BibTeXエントリと引用情報
By David Adelani
利用目的と制限事項
制限事項とバイアス
このモデルは、特定の期間のエンティティがアノテートされたニュース記事の学習データセットに制限されています。このため、異なるドメインのすべてのユースケースに対して汎化性能が十分でない可能性があります。