B

Bibert Ende

由jhu-clsp開發
BiBERT-ende是一個專為神經機器翻譯(NMT)優化的雙語(英語-德語)預訓練語言模型,通過提供上下文嵌入提升翻譯性能。
下載量 40
發布時間 : 3/2/2022

模型概述

BiBERT-ende是一個定製化的雙語預訓練語言模型,旨在通過將上下文嵌入直接輸入到NMT編碼器中,簡化現有預訓練模型的整合過程,並實現最先進的翻譯性能。

模型特點

雙語預訓練
專門針對英語和德語的雙語預訓練,優化了跨語言上下文理解。
簡化整合
通過直接使用上下文嵌入作為NMT編碼器輸入,簡化了預訓練模型的整合過程。
隨機層選擇
提出隨機層選擇方法,確保充分利用上下文嵌入的不同層次特徵。
雙向翻譯模型
支持雙向翻譯(英語→德語和德語→英語),並在兩個方向上均實現高性能。

模型能力

英語到德語機器翻譯
德語到英語機器翻譯
上下文嵌入生成

使用案例

機器翻譯
IWSLT'14數據集翻譯
在IWSLT'14數據集上實現英語→德語30.45和德語→英語38.61的BLEU分數。
超越所有已發表的結果
WMT'14數據集翻譯
在WMT'14數據集上實現英語→德語31.26和德語→英語34.94的BLEU分數。
超越所有已發表的結果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase