G

Gemma 2 Llama Swallow 9b It V0.1

由 tokyotech-llm 开发
Gemma-2-Llama-Swallow系列模型是在Gemma-2基础上进行持续预训练构建的多语言大模型,特别增强了日语能力。
下载量 2,491
发布时间 : 4/23/2025

模型简介

该模型在保留英文能力的同时,通过约2000亿标记的持续预训练显著提升了日语处理能力,适用于多语言任务和日语指令任务。

模型特点

多语言能力增强
在保留原英文能力基础上,显著提升了日语处理能力
大规模持续预训练
使用约2000亿标记数据进行持续预训练,包含日语网络语料、维基百科等内容
指令微调优化
在专门构建的日语合成数据上进行有监督微调,提升指令任务表现

模型能力

日语文本生成
英语文本生成
多轮对话
机器翻译
数学推理
代码生成

使用案例

语言处理
日语对话系统
构建日语智能助手
在日语MT-Bench中获得0.759分
多语言内容生成
生成日语和英语内容
教育
日语学习辅助
帮助学习者练习日语
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase