R

Robbert V2 Dutch Base

pdelobelleによって開発
RobBERTは現在最先端のオランダ語BERTモデルで、RoBERTaアーキテクチャに基づいて最適化され、様々なテキスト分類とタグ付けタスクに適しています。
ダウンロード数 7,891
リリース時間 : 3/2/2022

モデル概要

RobBERTは大規模に事前学習された汎用オランダ語言語モデルで、微調整することでテキスト分類、回帰、またはタグ付けタスクに適応できます。オランダ語のNLPタスクの多くで最良の性能を発揮し、感情分析、照応解消、固有表現認識などが含まれます。

モデル特徴

オランダ語最適化
オランダ語に特化して訓練され、オランダ語のトークナイザーと66億語の大規模コーパスを使用しています。
RoBERTaアーキテクチャの優位性
最適化されたRoBERTaアーキテクチャを採用しており、元のBERTよりも性能が高いです。
少サンプル学習能力
少ないデータセットのシナリオで特に優れた性能を発揮し、他のモデルよりも著しく優れています。

モデル能力

感情分析
照応解消
固有表現認識
品詞タグ付け
マスク言語モデリング
テキスト分類

使用事例

感情分析
書評の感情分類
オランダ語の書評の肯定的または否定的な感情を分析します。
正解率95.1%で、ULMFiT(93.8%)とBERTje(93.0%)よりも優れています。
構文解析
die/dat照応解消
文で'die'または'dat'のどちらを使用すべきかを予測します。
全データ微調整の正解率99.23%、少サンプル(1万)で97.82%です。
品詞タグ付け
オランダ語のテキストに品詞を付けます。
Lassy UDデータセットの正解率96.4%で、mBERT(96.5%)に近いです。
情報抽出
固有表現認識
テキスト中の人名、地名などのエンティティを識別します。
CoNLL 2002データセットのF1値89.08%で、mBERT(90.94%)に近いです。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase