L

Llama PLLuM 8B Chat

由 CYFRAGOVPL 开发
PLLuM 是一个专注于波兰语及其他斯拉夫/波罗的海语言的大型语言模型家族,同时融入英语数据以实现更广泛的泛化能力。
下载量 2,618
发布时间 : 2/7/2025

模型简介

PLLuM 系列模型旨在生成上下文连贯的文本,为各种任务(如问答、摘要)提供帮助,并为特定领域的应用(如特定领域的智能助手)奠定基础。

模型特点

广泛的数据收集
收集了大规模、高质量的波兰语文本数据(清理和去重后约 1500 亿个标记),以及斯拉夫语、波罗的海语和英语的额外文本。
有机指令数据集
精心策划了最大的波兰语手动创建的“有机指令”集合(约 40000 个提示-响应对),涵盖了监督微调中自动化方法可能忽略的一系列细微方面。
波兰语偏好语料库
创建了第一个波兰语偏好语料库,其中包含由具有不同人口统计学特征的注释团队手动评估的提示和多个模型响应。
评估基准
开发了自定义基准,用于评估模型在与波兰公共管理相关的任务上的表现,PLLuM 在所有测试模型中取得了最高分。

模型能力

文本生成
问答
摘要
检索增强生成(RAG)
多语言支持

使用案例

通用语言任务
文本生成
生成上下文连贯的文本,如诗歌、文章等。
生成高质量的波兰语文本,适用于多种场景。
问答
回答用户提出的问题,基于提供的文档或通用知识。
提供准确且上下文相关的回答。
特定领域助手
公共管理
为波兰公共管理提供专业支持,如法律或官僚主题的信息检索和问答。
在复杂信息检索和问答方面表现出色。
研发
下游人工智能应用
作为基础构建模块,用于需要精通波兰语的下游人工智能应用。
为学术或工业环境提供强大的语言模型支持。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase