E

Eurollm 1.7B

由 utter-project 开发
EuroLLM-1.7B 是 EuroLLM 系列的首个预训练模型,具备多语言处理能力,可理解和生成多种欧洲及其他相关语言的文本。
下载量 3,444
发布时间 : 8/6/2024

模型简介

EuroLLM-1.7B 是一个具有 17 亿参数的模型,在 4 万亿个标记上进行训练,支持多种欧洲及其他相关语言。其指令微调版本 EuroLLM-1.7B-Instruct 在机器翻译等任务上表现出色。

模型特点

多语言支持
支持多种欧洲及其他相关语言,包括保加利亚语、克罗地亚语、捷克语、丹麦语、荷兰语、英语等。
高效架构
采用标准的密集 Transformer 架构,使用分组查询注意力(GQA)、预层归一化、RMSNorm、SwiGLU 激活函数和旋转位置嵌入(RoPE)等技术,在推理速度和下游任务性能之间取得平衡。
大规模训练
在 4 万亿个标记上进行训练,数据来源广泛,包括网络数据、平行数据和高质量数据集。
出色性能
在机器翻译和通用基准测试中表现优异,与同类模型相比具有竞争力。

模型能力

文本生成
机器翻译
多语言处理

使用案例

机器翻译
多语言翻译
支持多种语言之间的翻译任务,如英语到葡萄牙语、德语到英语等。
在 FLORES-200、WMT-23 和 WMT-24 等基准测试中表现优异,优于 Gemma-2B,与 Gemma-7B 具有竞争力。
通用文本生成
多语言文本生成
生成多种语言的连贯文本,适用于多语言内容创作。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase