microtransquest-en_zh-wikiオープンソース翻訳評価モデル - 句レベルと単語レベルの翻訳品質予測を無料で実現

ホーム

Microtransquest En Zh Wiki

TransQuestによって開発

クロス言語Transformerに基づく翻訳品質評価モデルで、文レベルと単語レベルの品質予測をサポートします。

質問応答システム

Transformers

オープンソースライセンス:Apache-2.0 #翻訳品質評価 #クロス言語Transformer #参照なし評価

ダウンロード数 27

リリース時間 : 3/2/2022

モデル概要

TransQuestは、参照訳を必要とせずに自動的に翻訳品質を評価できるシステムで、15の言語ペアをサポートし、WMT 2020品質評価タスクで優れた成績を収めています。

モデル特徴

多レベル評価

ドキュメントレベル、文レベル、単語レベルの3つのレベルの翻訳品質評価をサポートします。

2次元予測

翻訳後編集作業量（PE effort）と直接品質スコア（DA score）を同時に予測できます。

多言語対応

英語 - 中国語などの一般的な言語ペアを含む15の言語ペアの事前学習モデルを提供します。

性能が高い

WMT 2020評価でOpenKiwiやDeepQuestなどの既存の手法を上回っています。

モデル能力

機械翻訳品質スコアリング

翻訳後編集必要性予測

誤り単語の特定

多言語品質評価

使用事例

翻訳サービス

エンジン選択

複数の翻訳エンジンが選択可能な場合、自動的に最適な翻訳を選択します。

翻訳作業フローの効率を向上させます。

品質警告

エンドユーザーに機械翻訳内容の信頼性を提示します。

低品質の翻訳を誤用するリスクを低減します。

ローカライゼーションプロセス

自動品質検査

翻訳文が直接公開可能か、または人手による介入が必要かを判定します。

翻訳後編集リソースの割り当てを最適化します。

🚀 TransQuest：クロス言語Transformerに基づく翻訳品質評価

翻訳品質評価（QE）は、参照訳がない状況で翻訳の品質を評価することを目的としています。高精度で、多くの言語ペアに容易に展開できるQE技術は、多くの商業的な翻訳ワークフローに欠けている要素であり、多くの潜在的な用途があります。複数の翻訳エンジンが利用可能な場合、最適な翻訳を選択するために使用できます。また、エンドユーザーに自動翻訳内容の信頼性を知らせることもできます。さらに、QEシステムは、特定の文脈で翻訳が直接公開できるか、公開前に人手による後編集が必要か、または人手による再翻訳が必要かを判断するために使用できます。品質評価は、ドキュメントレベル、文レベル、単語レベルといった異なるレベルで行うことができます。

TransQuestを通じて、我々は翻訳品質評価に関する研究成果をオープンソース化しています。この成果は、WMT 2020の文レベル直接評価品質評価共有タスクで受賞しています。TransQuestは、OpenKiwiやDeepQuestなどの現在のオープンソース品質評価フレームワークよりも優れた性能を発揮します。

✨ 主な機能

文レベルの翻訳品質評価で、後編集作業量の予測と直接評価の両方をカバーします。
単語レベルの翻訳品質評価で、ソース単語、ターゲット単語、ターゲットギャップの品質を予測できます。
すべての実験言語において、DeepQuestやOpenKiwiなどの現在の最先端の品質評価方法よりも優れた性能を発揮します。
HuggingFaceでは、15の言語ペアの事前学習済み品質評価モデルを提供しています。

📦 インストール

pipを使用したインストール

pip install transquest

ソースコードからのインストール

git clone https://github.com/TharinduDR/TransQuest.git
cd TransQuest
pip install -r requirements.txt

💻 使用例

基本的な使用法

from transquest.algo.word_level.microtransquest.run_model import MicroTransQuestModel
import torch

model = MicroTransQuestModel("xlmroberta", "TransQuest/microtransquest-en_zh-wiki", labels=["OK", "BAD"], use_cuda=torch.cuda.is_available())
source_tags, target_tags = model.predict([["if not , you may not be protected against the diseases . ", "ja tā nav , Jūs varat nepasargāt no slimībām . "]])

📚 ドキュメント

詳細な情報は、以下のドキュメントを参照してください。

インストール - pipを使用してTransQuestをローカルにインストールします。
アーキテクチャ - TransQuestで実装されているアーキテクチャを確認します。
1. 文レベルのアーキテクチャ - 文レベルの品質評価を行うための2つのアーキテクチャ、MonoTransQuestとSiameseTransQuestを公開しています。
2. 単語レベルのアーキテクチャ - 単語レベルの品質評価を行うためのMicroTransQuestを公開しています。
使用例 - 最近のWMT品質評価共有タスクでTransQuestを使用する方法のいくつかの例を提供しています。
1. 文レベルの使用例
2. 単語レベルの使用例
事前学習済みモデル - 文レベルと単語レベルをカバーする15の言語ペアの事前学習済み品質評価モデルを提供しています。
1. 文レベルのモデル
2. 単語レベルのモデル
お問い合わせ - TransQuestに関する質問がある場合は、お問い合わせください。

📄 ライセンス

このプロジェクトは、Apache 2.0ライセンスの下で提供されています。

📖 引用

単語レベルのアーキテクチャを使用する場合は、ACL 2021で受け入れられたこの論文を引用することを検討してください。

@InProceedings{ranasinghe2021,
author = {Ranasinghe, Tharindu and Orasan, Constantin and Mitkov, Ruslan},
title = {An Exploratory Analysis of Multilingual Word Level Quality Estimation with Cross-Lingual Transformers},
booktitle = {Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics},
year = {2021}
}

文レベルのアーキテクチャを使用する場合は、COLING 2020とWMT 2020（EMNLP 2020期間中）で発表されたこれらの論文を引用することを検討してください。

@InProceedings{transquest:2020a,
author = {Ranasinghe, Tharindu and Orasan, Constantin and Mitkov, Ruslan},
title = {TransQuest: Translation Quality Estimation with Cross-lingual Transformers},
booktitle = {Proceedings of the 28th International Conference on Computational Linguistics},
year = {2020}
}

@InProceedings{transquest:2020b,
author = {Ranasinghe, Tharindu and Orasan, Constantin and Mitkov, Ruslan},
title = {TransQuest at WMT2020: Sentence-Level Direct Assessment},
booktitle = {Proceedings of the Fifth Conference on Machine Translation},
year = {2020}
}