B

Bertovski

MaCoCuによって開発
BERTovskiはブルガリア語とマケドニア語のテキストで訓練された大規模事前学習言語モデルで、RoBERTaアーキテクチャを採用し、MaCoCuプロジェクトの成果です。
ダウンロード数 28
リリース時間 : 8/11/2022

モデル概要

BERTovskiはブルガリア語とマケドニア語に特化した自然言語処理モデルで、品詞タグ付け、固有表現認識などの多様な言語タスクに適しています。

モデル特徴

多言語サポート
ブルガリア語とマケドニア語に焦点を当てつつ、多言語処理タスクもサポートします。
高品質な訓練データ
訓練データは厳選されており、オリジナルの.bg/.mkドメインの高品質テキストのみを含み、低品質な機械翻訳コンテンツを排除しています。
バランスの取れたデータ分布
マケドニア語データを複製することでコーパスの比率を調整し、両言語のモデル内でのバランスの取れた性能を確保しています。

モデル能力

品詞タグ付け
固有表現認識
常識推論
テキスト理解

使用事例

自然言語処理
ブルガリア語品詞タグ付け
Universal Dependenciesデータセットで品詞タグ付けタスクを実行。
テストセット精度99.1%
マケドニア語固有表現認識
babushka-benchデータセットで固有表現認識を実行。
テストセット精度94.6%
言語理解
常識推論
COPAテストセットで常識推論タスクを実行。
ブルガリア語51.7%、マケドニア語51.8%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase