🚀 en2ko
这个模型是基于 KETI-AIR/long-ke-t5-base 在 KETI-AIR/aihub_koenzh_food_translation、KETI-AIR/aihub_scitech_translation、KETI-AIR/aihub_scitech20_translation、KETI-AIR/aihub_socialtech20_translation、KETI-AIR/aihub_spoken_language_translation 数据集上进行微调的版本。它在评估集上取得了以下成果:
- 损失值:0.6000
- BLEU分数:42.463
- 生成长度:30.6512
✨ 主要特性
- 支持英语到韩语的翻译任务。
- 基于预训练模型 KETI-AIR/long-ke-t5-base 进行微调,在特定数据集上有较好的表现。
📚 详细文档
模型描述
该模型是在特定数据集上对基础模型 KETI-AIR/long-ke-t5-base 进行微调得到的,用于英语到韩语的翻译任务。
预期用途与限制
文档暂未提供相关信息。
训练和评估数据
使用了 KETI-AIR/aihub_koenzh_food_translation、KETI-AIR/aihub_scitech_translation、KETI-AIR/aihub_scitech20_translation、KETI-AIR/aihub_socialtech20_translation、KETI-AIR/aihub_spoken_language_translation 等数据集。
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率:0.001
- 训练批次大小:16
- 评估批次大小:16
- 随机种子:42
- 分布式类型:多GPU
- 设备数量:8
- 总训练批次大小:128
- 总评估批次大小:128
- 优化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e-08)
- 学习率调度器类型:线性
- 训练轮数:3.0
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
BLEU分数 |
生成长度 |
0.6989 |
1.0 |
93762 |
0.6666 |
20.3697 |
18.1258 |
0.6143 |
2.0 |
187524 |
0.6181 |
21.2903 |
18.1428 |
0.5544 |
3.0 |
281286 |
0.6000 |
21.9763 |
18.1424 |
框架版本
- Transformers 4.25.1
- Pytorch 1.12.0
- Datasets 2.8.0
- Tokenizers 0.13.2
📄 许可证
本模型采用 Apache-2.0 许可证。
📦 相关信息
属性 |
详情 |
支持语言 |
英语、韩语 |
基础模型 |
KETI-AIR/long-ke-t5-base |
数据集 |
KETI-AIR/aihub_koenzh_food_translation、KETI-AIR/aihub_scitech_translation、KETI-AIR/aihub_scitech20_translation、KETI-AIR/aihub_socialtech20_translation、KETI-AIR/aihub_spoken_language_translation |
评估指标 |
BLEU |
任务类型 |
翻译 |
💻 使用示例
示例 1
输入: translate_en2ko: The Seoul Metropolitan Government said Wednesday that it would develop an AI-based congestion monitoring system to provide better information to passengers about crowd density at each subway station.
示例 2
输入: translate_en2ko: According to Seoul Metro, the operator of the subway service in Seoul, the new service will help analyze the real-time flow of passengers and crowd levels in subway compartments, improving operational efficiency.