R

Roberta Base Bne Capitel Ner

PlanTL-GOB-ESによって開発
RoBERTaアーキテクチャに基づくスペイン語の命名エンティティ認識モデルで、BNEコーパスで事前学習し、CAPITEL-NERCデータセットで微調整しました。
ダウンロード数 8,221
リリース時間 : 3/2/2022

モデル概要

このモデルは、スペイン語の命名エンティティ認識(NER)タスクに特化しており、テキスト内の人名、地名などのエンティティを認識できます。

モデル特徴

大規模事前学習
570GBのクリーニング済みスペイン語テキストを使用して事前学習しました。
専門分野の微調整
CAPITEL-NERC競技データセットで、命名エンティティ認識タスクに特化して微調整しました。
高性能
CAPITEL-NERCテストセットで89.60のF1値を達成し、同類のベースラインモデルより優れています。

モデル能力

スペイン語テキスト処理
命名エンティティ認識
人名認識
地名認識
組織名認識

使用事例

情報抽出
文書エンティティ抽出
スペイン語文書から自動的に人名、地名などのエンティティ情報を抽出します。
テキスト内の命名エンティティを正確に認識します。
内容分類
認識されたエンティティに基づいて文書内容を分類します。
文書分類の精度を向上させます。
知識グラフ構築
エンティティ関係抽出
知識グラフ構築の前処理ステップとして使用します。
後続の関係抽出に基礎を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase