L

Lsg Camembert Base 4096

ccdvによって開発
CamemBERT-baseをベースに調整された長シーケンス処理モデルで、局所+疎+グローバル注意力機構(LSG)を採用し、長テキストを高効率に処理します。
ダウンロード数 108
リリース時間 : 3/2/2022

モデル概要

このモデルはフランス語の長テキストに対して最適化されており、CamemBERTの元のアーキテクチャを維持したままLSG注意力機構を導入し、4096の長さのコンテキスト処理をサポートします。

モデル特徴

長いコンテキスト処理
最大4096のトークンのシーケンス処理をサポートし、従来のTransformerモデルより優れています。
高効率注意力機構
局所+疎+グローバル(LSG)の混合注意力モードを採用し、Longformer/BigBirdよりも計算効率が高いです。
適応的シーケンス長
シーケンス長をブロックサイズの整数倍に自動的にパディングすることをサポートし、前処理の流れを簡素化します。
複数の疎モード
6種類の疎注意力選択戦略を提供し、タスクの要件に応じて柔軟に設定できます。

モデル能力

フランス語テキスト理解
長文書処理
マスク言語モデリング
シーケンス分類
テキスト特徴抽出

使用事例

テキスト理解
フランス語の長文書分類
フランス語の長い記事や文書に対してトピック分類を行います。
例では300語以上のシーケンスを効果的に処理できることが示されています。
言語モデリング
フランス語の穴埋め問題
マスクされたフランス語の単語を予測します。
例では「Paris est la capitale de la France」を成功に予測しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase