🚀 班圖語 - 英語翻譯模型
本項目提供了一個用於班圖語到英語翻譯的模型,支持多種班圖語系語言的翻譯,為跨語言交流提供了有力的工具。
🚀 快速開始
你可以通過以下鏈接下載模型的原始權重、測試集翻譯和測試集評分:
✨ 主要特性
- 多語言支持:支持多種班圖語系語言,包括斯瓦希里語(sn)、祖魯語(zu)、盧旺達語(rw)等。
- 模型類型:採用Transformer模型進行翻譯任務。
- 預處理:使用歸一化和SentencePiece(spm32k,spm32k)進行預處理。
📚 詳細文檔
翻譯信息
- 源語言組:班圖語系語言
- 目標語言組:英語
- OPUS說明文檔:bnt-eng
模型信息
屬性 |
詳情 |
模型類型 |
Transformer |
源語言 |
kin、lin、lug、nya、run、sna、swh、toi_Latn、tso、umb、xho、zul |
目標語言 |
eng |
預處理 |
歸一化 + SentencePiece(spm32k,spm32k) |
系統信息
- Hugging Face名稱:bnt-eng
- 源語言:bnt
- 目標語言:eng
- OPUS說明文檔URL:https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/bnt-eng/README.md
- 原始倉庫:Tatoeba-Challenge
- 標籤:['translation']
- 支持語言:['sn', 'zu', 'rw', 'lg', 'ts', 'ln', 'ny', 'xh', 'rn', 'bnt', 'en']
- 源語言成分:{'sna', 'zul', 'kin', 'lug', 'tso', 'lin', 'nya', 'xho', 'swh', 'run', 'toi_Latn', 'umb'}
- 目標語言成分:{'eng'}
- 源語言多語言性:True
- 目標語言多語言性:False
- 預處理:歸一化 + SentencePiece(spm32k,spm32k)
- 模型URL:https://object.pouta.csc.fi/Tatoeba-MT-models/bnt-eng/opus2m-2020-07-31.zip
- 測試集URL:https://object.pouta.csc.fi/Tatoeba-MT-models/bnt-eng/opus2m-2020-07-31.test.txt
- 源語言ISO 639-3代碼:bnt
- 目標語言ISO 639-3代碼:eng
- 短語言對:bnt-en
- chrF2評分:0.39399999999999996
- BLEU評分:23.1
- 簡潔懲罰:1.0
- 參考長度:14565.0
- 源語言名稱:班圖語系語言
- 目標語言名稱:英語
- 訓練日期:2020-07-31
- 源語言ISO 639-2代碼:bnt
- 目標語言ISO 639-2代碼:en
- 是否偏好舊版本:False
- 長語言對:bnt-eng
- 赫爾辛基Git SHA:480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- Transformers Git SHA:2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植機器:brutasse
- 移植時間:2020-08-21-14:41
📊 基準測試
測試集 |
BLEU |
chr-F |
Tatoeba-test.kin-eng.kin.eng |
31.7 |
0.481 |
Tatoeba-test.lin-eng.lin.eng |
8.3 |
0.271 |
Tatoeba-test.lug-eng.lug.eng |
5.3 |
0.128 |
Tatoeba-test.multi.eng |
23.1 |
0.394 |
Tatoeba-test.nya-eng.nya.eng |
38.3 |
0.527 |
Tatoeba-test.run-eng.run.eng |
26.6 |
0.431 |
Tatoeba-test.sna-eng.sna.eng |
27.5 |
0.440 |
Tatoeba-test.swa-eng.swa.eng |
4.6 |
0.195 |
Tatoeba-test.toi-eng.toi.eng |
16.2 |
0.342 |
Tatoeba-test.tso-eng.tso.eng |
100.0 |
1.000 |
Tatoeba-test.umb-eng.umb.eng |
8.4 |
0.231 |
Tatoeba-test.xho-eng.xho.eng |
37.2 |
0.554 |
Tatoeba-test.zul-eng.zul.eng |
40.9 |
0.576 |
📄 許可證
本項目採用Apache 2.0許可證。