G

Gpt3 Finnish Large

由TurkuNLP開發
圖爾庫大學開發的8.81億參數芬蘭語生成式預訓練Transformer模型,基於BLOOM架構
下載量 627
發布時間 : 2/15/2023

模型概述

面向芬蘭語的單語預訓練語言模型,可作為基礎模型通過指令微調轉化為聊天模型

模型特點

大規模芬蘭語訓練
整合15+芬蘭語數據源,訓練數據達2070億字符量
科學採樣策略
對不同數據源採用1.0-3.0的差異化權重採樣
純語言模型設計
未經過指令微調的基礎模型,適合二次開發

模型能力

芬蘭語文本生成
語言模型微調基礎
上下文語義理解

使用案例

自然語言處理
聊天機器人基礎模型
通過指令微調轉化為芬蘭語對話系統
文本自動生成
生成芬蘭語新聞、故事等連貫文本
教育科研
語言模型研究
作為芬蘭語NLP研究的基線模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase