R

Robertalexpt Base

eduagarciaによって開発
RoBERTaLexPT-baseは、LegalPTとCrawlPTコーパスで事前学習された、法律分野に特化したポルトガル語マスク言語モデルです。
ダウンロード数 366
リリース時間 : 1/9/2024

モデル概要

このモデルはRoBERTaアーキテクチャに基づくポルトガル語言語モデルで、法律テキスト処理に特化しており、ポルトガル語(ブラジルおよびヨーロッパのバリエーションを含む)をサポートします。

モデル特徴

法律分野最適化
ポルトガル語法律テキストに特化した事前学習と最適化が行われています
多様なトレーニングデータ
法律分野(LegalPT)と一般分野(CrawlPT)のデータを組み合わせてトレーニング
高性能
ポルトガル語法律NLPタスクにおいて、同様のモデルよりも優れたパフォーマンスを発揮
データ重複排除
トレーニング前にMinHashアルゴリズムを使用してデータの重複排除を実施

モデル能力

ポルトガル語テキスト理解
法律テキスト分析
固有表現認識
トークン分類

使用事例

法律テキスト処理
法律文書分析
法律文書のキー情報を分析
PortuLexベンチマークテストで85.41%の平均F1スコアを達成
法律エンティティ認識
法律テキスト内の特定エンティティを識別
LeNERデータセットで90.73%のF1スコアを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase