J

Japanese Gpt Neox 3.6b

由rinna開發
一個擁有36億參數的日語GPT-NeoX模型,基於Transformer架構,在3125億token的日語語料上訓練。
下載量 34.74k
發布時間 : 5/17/2023

模型概述

這是一個基於GPT-NeoX架構的日語語言模型,主要用於文本生成任務,支持日語自然語言處理。

模型特點

大規模日語預訓練
在約3125億token的日語語料上訓練,包括CC-100、C4和日語維基百科。
優化的分詞器
使用基於sentencepiece的分詞器,支持UTF-8字節回退,保留空格信息。
高性能表現
最終驗證困惑度達到8.68,表明模型具有優秀的語言理解能力。

模型能力

日語文本生成
語言建模
自然語言處理

使用案例

文本生成
哲學文本續寫
給定哲學主題的開頭,模型能夠生成連貫的後續內容。
示例中成功生成了關於西田幾多郎哲學的連貫文本。
教育研究
日語語言研究
可用於研究日語語言模型的表現和特性。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase