mluke-baseオープンソース多言語AIモデル - 24種類の言語の命名エンティティ認識などのタスクをサポート

ホーム

Mluke Base

studio-ousiaによって開発

mLUKEはLUKEの多言語拡張バージョンで、24言語の固有表現認識、関係分類、質問応答システムのタスクをサポートします。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #多言語エンティティ認識 #クロス言語関係分類 #ウィキペディア事前学習

ダウンロード数 64

リリース時間 : 3/2/2022

モデル概要

mLUKEはXLM - RoBERTaで初期化された多言語事前学習モデルで、エンティティ感知アテンションメカニズムを持ち、様々な自然言語処理タスクに適しています。

モデル特徴

多言語サポート

主要なヨーロッパとアジアの言語を含む24言語のテキスト処理をサポートします。

エンティティ感知アテンション

特殊なエンティティ埋め込みとアテンションメカニズムを含み、固有表現をより良く処理できます。

大規模事前学習

24言語のウィキペディアデータを基に事前学習され、強力なクロス言語表現能力を持っています。

モデル能力

固有表現認識

関係分類

質問応答システム

クロス言語テキスト理解

使用事例

情報抽出

多言語ドキュメントのエンティティ認識

多言語ドキュメントから固有表現を識別して分類します。

24言語のエンティティを正確に識別できます。

知識グラフ構築

クロス言語エンティティ関係抽出

多言語テキストからエンティティ間の関係を抽出します。

多言語知識グラフの構築をサポートします。

🚀 mLUKE

mLUKE (マルチリンガルLUKE) は、LUKEのマルチリンガル拡張版です。このモデルは、多言語に対応した自然言語処理タスクに役立ちます。

詳細と更新情報については、公式リポジトリをご確認ください。

このmLUKEベースモデルは、12の隠れ層と768の隠れサイズを持ちます。このモデルの総パラメータ数は5億8500万 (単語埋め込みとエンコーダが2億7800万、エンティティ埋め込みが3億700万) です。このモデルは、XLM - RoBERTa (ベース) の重みで初期化され、2020年12月版の24言語のWikipediaを使用して学習されました。

🚀 クイックスタート

このセクションでは、mLUKEモデルの基本的な使い方を説明します。

📚 ドキュメント

モデルの詳細

プロパティ	詳細
モデルタイプ	mLUKEベースモデル
学習データ	2020年12月版の24言語のWikipedia

注意事項

⚠️ 重要な注意

AutoModel.from_pretrained を使用してデフォルト設定でモデルをロードすると、次の警告が表示されます。

Some weights of the model checkpoint at studio-ousia/mluke-base-lite were not used when initializing LukeModel: [
'luke.encoder.layer.0.attention.self.w2e_query.weight', 'luke.encoder.layer.0.attention.self.w2e_query.bias', 
'luke.encoder.layer.0.attention.self.e2w_query.weight', 'luke.encoder.layer.0.attention.self.e2w_query.bias', 
'luke.encoder.layer.0.attention.self.e2e_query.weight', 'luke.encoder.layer.0.attention.self.e2e_query.bias', 
...]

これらの重みは、LUKE論文で説明されているエンティティ認識アテンションの重みです。use_entity_aware_attention はデフォルトで false に設定されているため、この警告は予想されるものです。ただし、事前学習された重みには、use_entity_aware_attention を有効にしてモデルに重みをロードする場合の重みが含まれています。

引用

もしあなたの研究や作業でmLUKEが役立った場合、次の論文を引用してください。

@inproceedings{ri-etal-2022-mluke,
    title = "m{LUKE}: {T}he Power of Entity Representations in Multilingual Pretrained Language Models",
    author = "Ri, Ryokan  and
      Yamada, Ikuya  and
      Tsuruoka, Yoshimasa",
    booktitle = "Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    year = "2022",
    url = "https://aclanthology.org/2022.acl-long.505",