X

Xlm Roberta Base Finetuned Swahili Finetuned Ner Swahili

mbeukmanによって開発
このモデルはMasakhaNERデータセット(スワヒリ語部分)でファインチューニングされた固有表現認識モデルで、スワヒリ語テキストのエンティティ認識タスクに適しています。
ダウンロード数 14
リリース時間 : 3/2/2022

モデル概要

xlm-roberta-baseアーキテクチャに基づき、スワヒリ語の固有表現認識タスク向けにファインチューニングされたTransformerモデルで、主にテキスト中の人名、地名、組織名、日付などのエンティティを識別します。

モデル特徴

アフリカ言語サポート
スワヒリ語に特化して最適化されており、アフリカ言語NLPモデルの空白を埋めます
多様なエンティティタイプ認識
日付、人名、組織名、地名など様々なエンティティタイプを認識可能
効率的なトレーニング
NVIDIA RTX3090グラフィックカードでわずか10-30分でファインチューニングが完了

モデル能力

スワヒリ語テキスト処理
固有表現認識
ニュース分野のエンティティ抽出

使用事例

NLP研究
解釈可能性研究
アフリカ言語モデルの解釈可能性と転移学習特性の研究に使用
低リソース言語NLP
低リソース言語NLP研究のベンチマークモデルとして
情報抽出
ニュース分析
スワヒリ語ニュースから主要なエンティティ情報を抽出
F1値90.36を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase