J

Japanese Gpt 1b

由rinna開發
由凜那株式會社訓練的13億參數日語GPT模型,專注於日語文本生成任務
下載量 2,763
發布時間 : 3/2/2022

模型概述

這是一個基於Transformer架構的大規模日語語言模型,主要用於日語文本生成和相關自然語言處理任務

模型特點

大規模日語預訓練
在Japanese C4、Japanese CC-100和Japanese Wikipedia等大規模日語數據集上訓練
優化的分詞處理
使用基於sentencepiece的分詞器,並補充了表情符號和特殊符號
高質量文本生成
在驗證集上達到約14的困惑度,能夠生成流暢的日語文本

模型能力

日語文本生成
語言建模
文本續寫

使用案例

學術研究
哲學文本生成
生成關於西田幾多郎哲學思想的連貫文本
示例中展示了模型能夠生成關於西田哲學與康德哲學對比的連貫文本
內容創作
日語文章續寫
根據給定開頭續寫完整的日語文章
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase