Legalbert
BERTアーキテクチャに基づく法律分野専用の事前学習モデルで、法律テキストの特性に合わせて最適化されています。
ダウンロード数 467
リリース時間 : 3/2/2022
モデル概要
このモデルは、大規模な法律判決テキストで継続的に事前学習されたBERTのバリエーションで、法律分野の自然言語処理タスク、例えば法律テキスト分類や事例分析などを処理するために特別に設計されています。
モデル特徴
法律分野の専門化
37GBの法律判決テキストに基づいて継続的に事前学習され、法律用語やテキスト構造に合わせて最適化されています。
大規模な学習データ
学習コーパスには3,446,187件の法律判決が含まれており、元のBERTの学習データ規模を大幅に上回っています。
マルチタスクサポート
マスク言語モデリング、次文予測、およびCaseHOLD多肢選択問題などの法律特有のタスクをサポートします。
モデル能力
法律テキスト理解
法律テキスト分類
法律多肢選択問題解答
法律テキスト生成
法律意味解析
使用事例
法律テキスト分析
先例破棄予測
法律判決テキストを分析して先例が破棄される可能性を予測します。
サービス利用規約分類
法律契約やサービス利用規約を自動的に分類します。
法律教育
CaseHOLD多肢選択問題解答
法律教育において、事例に基づく多肢選択問題の解答を支援します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98