MiniLM-L12xH384 XLM - Rオープンソース多言語モデル－軽量で実用的に多言語処理をサポート

ホーム

Xlm Roberta Comet Small

Unbabelによって開発

mMiniLM-L12xH384 XLM-R は軽量化された多言語事前学習モデルで、MiniLMv2アーキテクチャに基づき、関係蒸留技術によって従来のXLM-RoBERTaモデルを圧縮したものです。

大規模言語モデル

Transformers

#軽量多言語モデル #機械翻訳最適化 #自己注意蒸留

ダウンロード数 45

リリース時間 : 3/2/2022

モデル概要

このモデルはXLM-RoBERTaの軽量化バージョンで、多頭自己注意関係蒸留技術による圧縮が施されており、多言語自然言語処理タスクに適しています。

モデル特徴

軽量化設計

従来のXLM-RoBERTa基本版や大規模版と比べて軽量で、リソースが限られた環境に適している

多言語サポート

XLM-Rアーキテクチャに基づき、強力な多言語処理能力を備えている

関係蒸留技術

MiniLMv2の多頭自己注意関係蒸留手法を採用し、性能を維持しながらモデル規模を縮小

機械翻訳最適化

WMTの直接評価アノテーションデータを使用して微調整されており、機械翻訳関連タスクに特に適している

モデル能力

多言語テキスト理解

言語間表現学習

機械翻訳評価

テキスト分類

意味的類似度計算

使用事例

機械翻訳

翻訳品質評価

微調整済みモデルを利用して機械翻訳結果の品質を評価

WMTデータセットで良好なパフォーマンス

多言語事前学習

軽量な多言語事前学習モデルとして下流タスクに使用

言語間アプリケーション

言語間情報検索

異なる言語間のドキュメント類似度計算や情報検索に使用

多言語テキスト分類

複数言語のテキスト分類タスクをサポート

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Xlm Roberta Comet Small

モデル概要

モデル特徴

モデル能力

使用事例

🚀 モデル