BARThezオープンソースフランス語モデル - 無料デプロイで生成型タスクと抽象要約をサポート

ホーム

Barthez

moussaKamによって開発

BARThezはBARTアーキテクチャに基づくフランス語のシーケンス・ツー・シーケンス事前学習モデルで、抽象的要約などの生成タスクに特に適しています。

大規模言語モデル

Transformers

フランス語オープンソースライセンス:Apache-2.0 #フランス語テキスト生成 #シーケンス・ツー・シーケンス事前学習 #抽象的要約最適化

ダウンロード数 1,487

リリース時間 : 3/2/2022

モデル概要

BARThezは専門的なフランス語シーケンス・ツー・シーケンス事前学習モデルで、破損した入力文を再構築することで事前学習を行い、66GBのフランス語生テキストコーパスを使用しています。既存のBERTベースのフランス語モデルとは異なり、BARThezはエンコーダだけでなくデコーダも事前学習しているため、生成タスクに特に適しています。

モデル特徴

生成タスク最適化

BARThezはエンコーダだけでなくデコーダも事前学習しており、抽象的要約などの生成タスクに特に適しています。

大規模事前学習

66GBのフランス語生テキストコーパスを使用して事前学習を行い、幅広い言語現象をカバーしています。

複数バージョン対応

ベーシック版（BARThez）とラージ版（mBARThez）の2つのバージョンを提供し、様々なニーズに対応しています。

モデル能力

テキスト生成

抽象的要約

マスク埋め

使用事例

自然言語処理

フランス語テキスト要約

BARThezを使用してフランス語テキストの抽象的要約を生成します。

生成タスクで優れた性能を発揮します。

マスク埋めタスク

BARThezを使用して文中のマスク部分を埋めます。

欠落した語彙を正確に予測できます。

Property	Details
Model Type	シーケンス-to-シーケンス事前学習モデル
Architecture	BASE (BARThez), LARGE (mBARThez)
#layers	12 (BARThez), 24 (mBARThez)
#params	165M (BARThez), 458M (mBARThez)
Model Links	BARThez, mBARThez