bert-large-swedish-casedオープンソーススウェーデン語モデル - 3.4億のパラメータを備え、スウェーデン語のテキスト処理を支援

ホーム

Bert Large Swedish Cased

AI-Nordicsによって開発

Megatron-LMフレームワークに基づいて実装されたスウェーデン語Bert Largeモデルで、3億4000万のパラメータを含み、85GBのスウェーデン語テキストで事前学習されています。

大規模言語モデル

Transformers

その他#スウェーデン語NLP #大容量パラメータ #法律医療適合

ダウンロード数 734

リリース時間 : 3/2/2022

モデル概要

このモデルは大型のスウェーデン語BERTモデルで、主にマスク言語モデリングと次文予測タスクに使用され、特定の分野のタスクに微調整することができます。

モデル特徴

大規模事前学習

85GBのスウェーデン語の多様なコーパスで学習され、政治、法律、医療などの複数の分野をカバーしています。

深層モデルアーキテクチャ

24層のTransformer構造を採用し、16個のアテンションヘッドを持ち、1024のコンテキスト長をサポートします。

広範なデータソース

ウィキペディア、政府報告、文学作品、ウェブデータなど10種類以上のデータソースを統合しています。

モデル能力

スウェーデン語テキスト理解

マスク言語モデリング

次文予測

テキスト特徴抽出

使用事例

テキスト処理

スウェーデン語テキスト分類

モデルを微調整してスウェーデン語テキストを分類します。

質問応答システム

スウェーデン語質問応答システムの基礎モデルを構築します。

情報抽出

固有表現認識

スウェーデン語テキスト中の特定のエンティティを識別します。

🚀 スウェーデン語のBertモデル

このモデルは、マスク付き言語モデリングや次文予測などのタスクに使用できるスウェーデン語用のBertモデルです。

🚀 クイックスタート

このモデルを使用するには、以下のコードを実行します。

from transformers import AutoTokenizer, AutoModelForMaskedLM
tokenizer = AutoTokenizer.from_pretrained("AI-Nordics/bert-large-swedish-cased")
model = AutoModelForMaskedLM.from_pretrained("AI-Nordics/bert-large-swedish-cased")

✨ 主な機能

マスク付き言語モデリングや次文予測などの一般的なタスクに使用可能です。
下流タスクでの微調整により、特定のドメイン/タスクでの性能を向上させることができます。

📚 ドキュメント

モデルの説明

このモデルは、Megatron-LMフレームワークで実装されたBert Largeモデルのアーキテクチャに従っています。バッチサイズ512で600kステップのトレーニングを行いました。モデルは以下のパラメータを持っています。

パラメータ	値
\(n_{parameters}\)	340M
\(n_{layers}\)	24
\(n_{heads}\)	16
\(n_{ctx}\)	1024
\(n_{vocab}\)	30592

トレーニングデータ

このモデルは、以下に示す様々なソースから収集された約85GBのスウェーデン語のテキストコーパスで事前学習されています。

データセット	ジャンル	サイズ(GB)
Anföranden	政治	0.9
DCEP	政治	0.6
DGT	政治	0.7
Fass	医療	0.6
Författningar	法律	0.1
Web data	その他	45.0
JRC	法律	0.4
Litteraturbanken	書籍	0.3
SCAR	その他	28.0
SOU	政治	5.3
Subtitles	ドラマ	1.3
Wikipedia	事実	1.8