R

Roberta Large Ner English

Jean-Baptisteによって開発
RoBERTa-largeをベースに微調整された英語の命名エンティティ認識モデルで、conll2003データセットで訓練され、特にメール/チャットデータのエンティティ認識能力が最適化されています。
ダウンロード数 236.85k
リリース時間 : 3/2/2022

モデル概要

このモデルは英語の命名エンティティ認識タスクに特化しており、特に非公式テキスト(メール/チャットなど)のエンティティ認識に優れており、非大文字始まりのエンティティ認識の結果も良好です。

モデル特徴

最適化された非公式テキスト処理
メールとチャットデータで検証され、他のモデルよりも優れた性能を発揮し、非公式テキストの処理に特に適しています。
非大文字始まりのエンティティ認識
非大文字始まりのエンティティ認識の結果が他のモデルよりも著しく優れています。
簡素化されたラベル体系
B-とI-の接頭辞を削除し、PER/ORG/LOC/MISC/Oの5種類の簡素化されたラベル体系を使用しています。

モデル能力

英語の命名エンティティ認識
非公式テキスト処理
多クラスのエンティティ分類

使用事例

テキスト分析
メール署名検出
メール内の署名部分と含まれる人名、職位などの情報を識別します。
提供されたMedium記事を参考に、LSTMモデルの訓練に使用できます。
チャット記録分析
インスタントメッセージやチャット記録から人名、組織名、場所などの情報を抽出します。
私有データセットでPERエンティティのF1値が0.8967に達しました。
情報抽出
ニューステキスト分析
ニュース記事から人名、組織名、場所などの重要な情報を抽出します。
conll2003検証セットでの総合F1値が0.9753に達しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase