X

Xlm Roberta Base Finetuned Amharic Finetuned Ner Swahili

mbeukmanによって開発
これはマーキング分類モデル(具体的には固有表現認識)で、アムハラ語でファインチューニングされたXLM-RoBERTaベースモデルを基に、MasakhaNERデータセットのスワヒリ語部分に対して二次ファインチューニングを行いました。
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

このモデルはTransformerアーキテクチャに基づいており、MasakhaNERデータセットでファインチューニングされ、主にスワヒリ語の固有表現認識タスクに使用されます。

モデル特徴

クロスリンガル転移学習
アムハラ語でファインチューニングされたXLM-RoBERTaモデルをさらにスワヒリ語でファインチューニングし、クロスリンガル転移学習の能力を示しています。
アフリカ言語サポート
アフリカ言語(スワヒリ語)の固有表現認識タスクに特化して最適化されています。
効率的なトレーニング
各モデルのファインチューニングにはわずか10-30分しかかからず、NVIDIA RTX3090グラフィックカードで完了しました。

モデル能力

スワヒリ語の固有表現認識
ニュース分野のエンティティ抽出
日付、場所、組織、人名の認識

使用事例

ニュース分析
ニュースエンティティ抽出
スワヒリ語のニュースから主要なエンティティ情報を抽出
総合F1値86.66
言語研究
アフリカ言語処理
アフリカ言語の自然言語処理研究に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase