🚀 ara - spa
ara - spa 是一個專注於阿拉伯語到西班牙語的翻譯項目,提供了特定的翻譯模型及相關測試數據,可用於阿拉伯語與西班牙語之間的翻譯任務。
✨ 主要特性
- 語言支持:支持從阿拉伯語(包括多種變體如 apc、apc_Latn、ara、arq 等)到西班牙語的翻譯。
- 模型類型:採用 transformer 模型。
- 預處理方式:進行了歸一化處理,並使用 SentencePiece(spm32k, spm32k)。
📚 詳細文檔
項目信息
- 源語言組:阿拉伯語
- 目標語言組:西班牙語
- OPUS 說明文檔:[ara - spa](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/ara - spa/README.md)
模型相關
- 模型類型:transformer
- 源語言:apc、apc_Latn、ara、arq
- 目標語言:spa
- 預處理:歸一化 + SentencePiece(spm32k, spm32k)
- 原始權重下載:[opus - 2020 - 07 - 03.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.zip)
- 測試集翻譯:[opus - 2020 - 07 - 03.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.test.txt)
- 測試集分數:[opus - 2020 - 07 - 03.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.eval.txt)
基準測試
測試集 |
BLEU |
chr - F |
Tatoeba - test.ara.spa |
46.0 |
0.641 |
系統信息
屬性 |
詳情 |
hf 名稱 |
ara - spa |
源語言 |
ara |
目標語言 |
spa |
OPUS 說明文檔鏈接 |
https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/ara - spa/README.md |
原始倉庫 |
Tatoeba - Challenge |
標籤 |
['translation'] |
語言 |
['ar', 'es'] |
源語言成分 |
{'apc', 'ara', 'arq_Latn', 'arq', 'afb', 'ara_Latn', 'apc_Latn', 'arz'} |
目標語言成分 |
{'spa'} |
源語言多語言特性 |
False |
目標語言多語言特性 |
False |
預處理 |
歸一化 + SentencePiece(spm32k, spm32k) |
模型鏈接 |
https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.zip |
測試集鏈接 |
https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.test.txt |
源語言 ISO 639 - 3 代碼 |
ara |
目標語言 ISO 639 - 3 代碼 |
spa |
短語言對 |
ar - es |
chrF2 分數 |
0.6409999999999999 |
BLEU 分數 |
46.0 |
簡潔懲罰係數 |
0.9620000000000001 |
參考長度 |
9708.0 |
源語言名稱 |
阿拉伯語 |
目標語言名稱 |
西班牙語 |
訓練日期 |
2020 - 07 - 03 |
源語言 ISO 639 - 2 代碼 |
ar |
目標語言 ISO 639 - 2 代碼 |
es |
是否優先使用舊版本 |
False |
長語言對 |
ara - spa |
Helsinki Git SHA |
480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535 |
Transformers Git SHA |
2207e5d8cb224e954a7cba69fa4ac2309e9ff30b |
移植機器 |
brutasse |
移植時間 |
2020 - 08 - 21 - 14:41 |
📄 許可證
本項目採用 Apache - 2.0 許可證。