オープンソースのTransQuest翻訳品質評価フレームワーク - 無料でデプロイして翻訳評価の精度を向上させる

ホーム

Monotransquest Da Any En

TransQuestによって開発

TransQuestは翻訳品質評価のためのオープンソースフレームワークで、WMT 2020文レベル直接評価品質評価共有タスクで優勝しました。

機械翻訳

Transformers

オープンソースライセンス:Apache-2.0 #翻訳品質評価 #多言語サポート #文レベル予測

ダウンロード数 29

リリース時間 : 3/2/2022

モデル概要

TransQuestは文レベルと単語レベルの翻訳品質評価機能を提供し、後編集需要の予測と直接評価をサポートし、複数の言語ペアに適用可能です。

モデル特徴

高品質評価性能

WMT 2020品質評価タスクで優れた性能を発揮し、OpenKiwiやDeepQuestなどの既存フレームワークを凌駕

多言語サポート

15言語ペアの事前学習済み品質評価モデルを提供

多レベル評価

ドキュメントレベル、文レベル、単語レベルの3つのレベルで翻訳品質を評価可能

2種類の評価方法

後編集需要の予測と直接評価の2種類の品質評価方法をサポート

モデル能力

翻訳品質評価

後編集需要の予測

翻訳品質の直接評価

単語レベル品質評価

文レベル品質評価

使用事例

機械翻訳

翻訳エンジン選択

複数の翻訳エンジンが利用可能な場合、最適な翻訳結果を選択するために使用

翻訳品質選択の精度向上

翻訳コンテンツの信頼性評価

エンドユーザーに自動翻訳コンテンツの信頼性評価を提供

翻訳結果に対するユーザーの信頼感向上

翻訳公開判断

翻訳を直接公開するか、人手による後編集が必要かを決定

翻訳ワークフローの最適化

🚀 TransQuest: クロス言語トランスフォーマーを用いた翻訳品質推定

翻訳品質推定（Quality Estimation, QE）の目的は、参照訳を使用せずに翻訳の品質を評価することです。多くの言語ペアに簡単に展開できる高精度のQEは、多くの商業的な翻訳ワークフローに欠けている要素であり、多くの潜在的な用途があります。複数の翻訳エンジンが利用可能な場合に最適な翻訳を選択するために使用したり、自動翻訳コンテンツの信頼性についてエンドユーザーに通知することができます。さらに、QEシステムは、翻訳が特定のコンテキストでそのまま公開できるか、公開前に人手による編集が必要か、または人による最初からの翻訳が必要かを判断するために使用できます。品質推定は、ドキュメントレベル、文レベル、単語レベルなど、さまざまなレベルで行うことができます。

TransQuestでは、翻訳品質推定に関する研究をオープンソース化しています。この研究は、WMT 2020の文レベルの直接評価品質推定共有タスクでも優勝しています。TransQuestは、OpenKiwiやDeepQuestなどの現在のオープンソースの品質推定フレームワークを上回っています。

✨ 主な機能

文レベルの翻訳品質推定：編集後の作業量の予測と直接評価の両面で行えます。
単語レベルの翻訳品質推定：原文の単語、訳文の単語、および訳文の空白部分の品質を予測できます。
実験したすべての言語で、DeepQuestやOpenKiwiなどの現在の最先端の品質推定方法を上回っています。
15の言語ペアに対する事前学習済みの品質推定モデルがHuggingFaceで利用可能です。

📦 インストール

pipからのインストール

pip install transquest

ソースからのインストール

git clone https://github.com/TharinduDR/TransQuest.git
cd TransQuest
pip install -r requirements.txt

💻 使用例

基本的な使用法

import torch
from transquest.algo.sentence_level.monotransquest.run_model import MonoTransQuestModel

model = MonoTransQuestModel("xlmroberta", "TransQuest/monotransquest-da-any_en", num_labels=1, use_cuda=torch.cuda.is_available())
predictions, raw_outputs = model.predict([["Reducerea acestor conflicte este importantă pentru conservare.", "Reducing these conflicts is not important for preservation."]])
print(predictions)

📚 ドキュメント

詳細については、以下のドキュメントを参照してください。

インストール - pipを使用してTransQuestをローカルにインストールします。
アーキテクチャ - TransQuestで実装されているアーキテクチャを確認します。
1. 文レベルのアーキテクチャ - 文レベルの品質推定を行うために、MonoTransQuestとSiameseTransQuestの2つのアーキテクチャを公開しています。
2. 単語レベルのアーキテクチャ - 単語レベルの品質推定を行うために、MicroTransQuestを公開しています。
使用例 - 最近のWMT品質推定共有タスクでTransQuestを使用する方法のいくつかの例を提供しています。
1. 文レベルの使用例
2. 単語レベルの使用例
事前学習済みモデル - 文レベルと単語レベルの両方をカバーする15の言語ペアに対する事前学習済みの品質推定モデルを提供しています。
1. 文レベルのモデル
2. 単語レベルのモデル
お問い合わせ - TransQuestに関する問題があれば、お問い合わせください。

📄 ライセンス

このプロジェクトは、Apache License 2.0の下でライセンスされています。

引用

単語レベルのアーキテクチャを使用する場合は、ACL 2021に採択されたこの論文を引用してください。

@InProceedings{ranasinghe2021,
author = {Ranasinghe, Tharindu and Orasan, Constantin and Mitkov, Ruslan},
title = {An Exploratory Analysis of Multilingual Word Level Quality Estimation with Cross-Lingual Transformers},
booktitle = {Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics},
year = {2021}
}

文レベルのアーキテクチャを使用する場合は、COLING 2020およびWMT 2020（EMNLP 2020）で発表されたこれらの論文を引用してください。

@InProceedings{transquest:2020a,
author = {Ranasinghe, Tharindu and Orasan, Constantin and Mitkov, Ruslan},
title = {TransQuest: Translation Quality Estimation with Cross-lingual Transformers},
booktitle = {Proceedings of the 28th International Conference on Computational Linguistics},
year = {2020}
}

@InProceedings{transquest:2020b,
author = {Ranasinghe, Tharindu and Orasan, Constantin and Mitkov, Ruslan},
title = {TransQuest at WMT2020: Sentence-Level Direct Assessment},
booktitle = {Proceedings of the Fifth Conference on Machine Translation},
year = {2020}
}