Q

Qra 1b

由OPI-PG開發
Qra是由波蘭國家信息處理研究所與格但斯克理工大學聯合開發的波蘭語優化大語言模型系列,基於TinyLlama-1.1B初始化並在900億波蘭語token上訓練
下載量 246
發布時間 : 2/26/2024

模型概述

專為波蘭語優化的基礎語言模型,需微調後用於對話或指令任務

模型特點

波蘭語優化
基於900億精選波蘭語token訓練,專為波蘭語文本處理優化
高效訓練技術
採用Flash Attention 2、混合精度訓練、FSDP並行等現代優化技術
嚴格數據清洗
通過多階段過濾流程確保訓練數據質量,包括語言分類、主題劃分和去重處理

模型能力

波蘭語文本生成
長文本處理(4096 token上下文)
語言建模

使用案例

文本處理
波蘭語內容生成
生成符合波蘭語習慣的文本內容
語言模型微調基礎
作為下游任務(如對話系統)的基礎模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase