N

Nekomata 14b

由rinna開發
基於Qwen-14B在混合日語和英語數據集上持續預訓練的大語言模型,顯著提升日語任務表現
下載量 705
發布時間 : 12/19/2023

模型概述

該模型是在660億token的混合日語和英語語料上對Qwen-14B進行持續預訓練得到的,特別優化了日語處理能力,同時保留了原始Qwen模型的優秀特性。

模型特點

高效日語處理
使用Qwen詞彙表(詞彙量>15萬),日語文本處理效率比youri系列更高
長上下文支持
支持最大8192的序列長度
多語言能力
在日語和英語混合語料上訓練,具備雙語處理能力
高性能分詞
使用擴展的cl100k tiktoken分詞器,日語分詞效率顯著優於llama-2分詞器

模型能力

日語文本生成
英語文本生成
長文本處理

使用案例

內容創作
日語文章續寫
根據開頭自動生成連貫的日語文章
示例中展示了'西田幾多郎は、'開頭的文章續寫效果
語言學習
雙語文本生成
生成日語和英語的雙語內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase