P

Poro 34B

由LumiOpen開發
Poro是一個340億參數的多語言大模型,專注於芬蘭語、英語和代碼處理,採用Apache 2.0許可證開源。
下載量 1,908
發布時間 : 10/19/2023

模型概述

基於芬蘭語、英語和代碼訓練的生成式Transformer模型,支持英芬互譯和代碼生成,適用於多語言NLP任務。

模型特點

多語言混合訓練
通過融合芬蘭語與英語數據提升低資源語言性能,同時保留英語能力
超大規模訓練
在LUMI超算上使用1萬億標記數據訓練,覆蓋文本與代碼
研究友好設計
提供訓練過程檢查點,支持研究不同訓練階段的模型行為

模型能力

芬蘭語文本生成
英語文本生成
代碼生成與補全
基礎英芬機器翻譯

使用案例

自然語言處理
芬蘭語內容生成
為芬蘭語應用自動生成文本內容
跨語言信息處理
處理英芬混合文本的NLP任務
軟件開發
代碼輔助
基於上下文生成或補全代碼片段
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase