P

Pllum 12B Nc Chat

由CYFRAGOVPL開發
PLLuM-12B-chat是波蘭大語言模型家族中的120億參數對話優化版本,專為波蘭語及斯拉夫/波羅的海語言設計,通過指令微調和偏好學習實現安全高效的交互能力。
下載量 2,673
發布時間 : 2/7/2025

模型概述

基於Mistral-Nemo架構的120億參數大語言模型,經過波蘭原生指令數據集微調和人類偏好對齊,在波蘭公共行政、法律文書等專業場景表現優異,支持檢索增強生成(RAG)應用。

模型特點

波蘭語原生優化
基於1500億波蘭語token及4萬條人工標註指令訓練,有效解決非波蘭語數據的負面遷移問題
安全對齊
通過首個波蘭語偏好數據集進行人類反饋強化學習(RLHF),確保爭議話題的平衡響應
檢索增強生成
專為RAG場景優化,可結合外部知識庫生成帶準確引用的專業回答
多規模選擇
提供從80億到700億參數的多種規格,滿足不同計算資源需求

模型能力

波蘭語文本生成
多輪對話處理
跨語言理解(斯拉夫/波羅的海語系)
專業領域問答
長文檔摘要
安全內容過濾

使用案例

公共行政
政府文書自動生成
根據政策文件自動生成標準化公文
在波蘭公共行政專項測試中排名第一
法規問答系統
解析法律條文並提供通俗解釋
教育
波蘭語學習助手
生成語法練習和提供寫作反饋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase