B

Bert Large Portuguese Cased Legal Tsdae Gpl Nli Sts V1

stjirisによって開発
BERTimbau大規模モデルに基づく法律分野専用のポルトガル語文変換器で、意味的類似度計算をサポートします。
ダウンロード数 17
リリース時間 : 1/5/2023

モデル概要

これはポルトガル語の法律テキストに最適化された文変換器モデルで、文を1024次元のベクトル空間にマッピングでき、法律分野の意味的検索、クラスタリング、テキスト類似度計算タスクに適しています。

モデル特徴

法律分野最適化
ポルトガル語の法律テキストに特化してトレーニングと最適化が行われ、約3万件の法律文書データを含んでいます。
先進的なトレーニング技術
TSDAE(Transformerベースの逐次ノイズ除去オートエンコーダ)技術を用いてトレーニングし、生成的擬似ラベル(GPL)による強化を組み合わせています。
多段階トレーニング
自然言語推論(NLI)と意味的テキスト類似度(STS)の多段階微調整を行っています。
高性能
複数のポルトガル語STSデータセットで優れた性能を発揮し、ピアソン相関係数が0.77 - 0.84に達しています。

モデル能力

文埋め込み生成
意味的類似度計算
法律テキスト分析
ポルトガル語処理
テキストクラスタリング

使用事例

法律テキスト処理
法律文書の意味的検索
法律文書ライブラリで意味に基づく検索機能を実現します。
最高裁判所の意味的検索システムで優れた性能を発揮します。
判例類似度分析
異なる判例文書間の意味的類似度を自動的に計算します。
汎用テキスト処理
テキストクラスタリング
類似した内容のポルトガル語文書を自動的にグループ化します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase