bertimbau-base-lener_brオープンソースモデル - 無料デプロイで、ポルトガル語テキストのエンティティを正確にタグ付け

ホーム

Bertimbau Base Lener Br

Lucianoによって開発

BERTimbau（ポルトガル語BERT）をベースに、lener_brデータセットで微調整した固有表現認識モデルで、ポルトガル語テキストのエンティティタグ付けタスクに使用されます。

シーケンスラベリング

Transformers

その他オープンソースライセンス:MIT #ポルトガル語NER #法律エンティティ識別 #高精度BERT

ダウンロード数 2,303

リリース時間 : 3/2/2022

モデル概要

このモデルは、ポルトガル語の固有表現認識タスクに特化して最適化されたBERTモデルで、lener_brデータセットで優れた性能を発揮し、法律分野のエンティティ識別アプリケーションに適しています。

モデル特徴

高精度ポルトガル語NER

lener_brテストセットで98.24%の正解率と98.74%のF1値を達成しました

法律分野最適化

法律テキストの固有表現認識に特化して微調整されています

BERTimbauベース

ポルトガル語に最適化されたBERTアーキテクチャを使用し、言語固有の特徴を捉えます

モデル能力

ポルトガル語テキストのエンティティ識別

法律文書のエンティティ抽出

タグ分類タスクの処理

使用事例

法律文書処理

法律契約書のエンティティ抽出

契約書内の当事者、日付、金額などの重要なエンティティを自動識別します

正解率98%を超えます

司法文書分析

裁判所文書から事件関連のエンティティ情報を抽出します

F1値が98.74%に達します

情報抽出システム

ポルトガル語ニュースのエンティティ識別

ニュース記事から人名、組織名、場所情報を抽出します

🚀 bertimbau-base-lener_br

このモデルは、lener_brデータセットでneuralmind/bert-base-portuguese-casedをファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。

損失: 0.2298
適合率: 0.8501
再現率: 0.9138
F1値: 0.8808
正解率: 0.9693

📚 ドキュメント

モデルの説明

詳細情報は後日追加予定です。

想定される用途と制限

詳細情報は後日追加予定です。

学習と評価データ

詳細情報は後日追加予定です。

学習手順

学習ハイパーパラメータ

学習中に使用されたハイパーパラメータは以下の通りです。

学習率: 2e-05
学習バッチサイズ: 4
評価バッチサイズ: 4
乱数シード: 42
オプティマイザ: ベータ=(0.9,0.999)、イプシロン=1e-08のAdam
学習率スケジューラの種類: 線形
エポック数: 15

学習結果

学習損失	エポック	ステップ	検証損失	適合率	再現率	F1値	正解率
0.0686	1.0	1957	0.1399	0.7759	0.8669	0.8189	0.9641
0.0437	2.0	3914	0.1457	0.7997	0.8938	0.8441	0.9623
0.0313	3.0	5871	0.1675	0.8466	0.8744	0.8603	0.9651
0.0201	4.0	7828	0.1621	0.8713	0.8839	0.8775	0.9718
0.0137	5.0	9785	0.1811	0.7783	0.9159	0.8415	0.9645
0.0105	6.0	11742	0.1836	0.8568	0.9009	0.8783	0.9692
0.0105	7.0	13699	0.1649	0.8339	0.9125	0.8714	0.9725
0.0059	8.0	15656	0.2298	0.8501	0.9138	0.8808	0.9693
0.0051	9.0	17613	0.2210	0.8437	0.9045	0.8731	0.9693
0.0061	10.0	19570	0.2499	0.8627	0.8946	0.8784	0.9681
0.0041	11.0	21527	0.1985	0.8560	0.9052	0.8799	0.9720
0.003	12.0	23484	0.2204	0.8498	0.9065	0.8772	0.9699
0.0014	13.0	25441	0.2152	0.8425	0.9067	0.8734	0.9709
0.0005	14.0	27398	0.2317	0.8553	0.8987	0.8765	0.9705
0.0015	15.0	29355	0.2436	0.8543	0.8989	0.8760	0.9700