L

Lsg Legal Small Uncased 4096

ccdvによって開発
LEGAL-BERTの小型版で、局所+疎+グローバル注意力機構(LSG)を用いて長シーケンスを効率的に処理します。
ダウンロード数 1,088
リリース時間 : 3/2/2022

モデル概要

このモデルはLEGAL-BERTの小型版で、長シーケンスの法律テキストを処理するために特別に最適化されています。革新的な局所+疎+グローバル注意力機構(LSG)を採用しており、速度と性能の面でLongformerやBigBirdなどの従来の長シーケンス処理モデルを上回っています。

モデル特徴

効率的な長シーケンス処理
LSG注意力機構を採用しており、最大4096トークンのシーケンスを効率的に処理でき、性能は従来の長シーケンスモデルを上回っています。
柔軟な設定
グローバルトークン数、ブロックサイズ、疎因子などのさまざまなパラメータを調整して、さまざまなタスクの要件に適応できます。
複数の疎パターン
6種類の疎選択タイプ(bos_pooling/norm/pooling/lsh/stride/block_stride)を提供して、さまざまなシーンに対応します。
適応的パディング
ブロックサイズに満たないシーケンスを自動的にパディングします。トークナイザの切り捨てとパディング機能と併用することをお勧めします。

モデル能力

長文処理
法律テキスト分析
マスク埋め予測
シーケンス分類

使用事例

法律テキスト処理
法律文書分類
長い法律文書を自動的に分類します。
最大4096トークンの文書シーケンスを処理できます。
法律用語予測
法律テキストの欠落した用語を予測します。
例では、「capital」や「happiness」などの用語を正確に予測できることが示されています。
汎用NLPタスク
長文分類
長いコンテキスト理解が必要な分類タスクを処理します。
モデルの出力には分類ロジットが含まれます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase