E

Eurollm 1.7B

由utter-project開發
EuroLLM-1.7B 是 EuroLLM 系列的首個預訓練模型,具備多語言處理能力,可理解和生成多種歐洲及其他相關語言的文本。
下載量 3,444
發布時間 : 8/6/2024

模型概述

EuroLLM-1.7B 是一個具有 17 億參數的模型,在 4 萬億個標記上進行訓練,支持多種歐洲及其他相關語言。其指令微調版本 EuroLLM-1.7B-Instruct 在機器翻譯等任務上表現出色。

模型特點

多語言支持
支持多種歐洲及其他相關語言,包括保加利亞語、克羅地亞語、捷克語、丹麥語、荷蘭語、英語等。
高效架構
採用標準的密集 Transformer 架構,使用分組查詢注意力(GQA)、預層歸一化、RMSNorm、SwiGLU 激活函數和旋轉位置嵌入(RoPE)等技術,在推理速度和下游任務性能之間取得平衡。
大規模訓練
在 4 萬億個標記上進行訓練,數據來源廣泛,包括網絡數據、平行數據和高質量數據集。
出色性能
在機器翻譯和通用基準測試中表現優異,與同類模型相比具有競爭力。

模型能力

文本生成
機器翻譯
多語言處理

使用案例

機器翻譯
多語言翻譯
支持多種語言之間的翻譯任務,如英語到葡萄牙語、德語到英語等。
在 FLORES-200、WMT-23 和 WMT-24 等基準測試中表現優異,優於 Gemma-2B,與 Gemma-7B 具有競爭力。
通用文本生成
多語言文本生成
生成多種語言的連貫文本,適用於多語言內容創作。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase