L

Llama 3 Swallow 8B Instruct V0.1

Developed by tokyotech-llm
基于Meta Llama 3构建的日语优化大语言模型,通过持续预训练增强日语能力,采用监督微调提升指令跟随能力
Downloads 13.88k
Release Time : 6/26/2024

Model Overview

Llama3 Swallow是基于Llama 3系列进行持续预训练的日语优化模型,主要增加了日语数据并采用SFT微调,支持日语和英语的多语言任务处理

Model Features

日语优化
通过持续预训练增强日语处理能力,在日语基准测试中表现优异
多语言支持
同时支持日语和英语,能处理跨语言任务
指令微调
采用监督微调(SFT)和聊天向量技术,提升指令跟随能力
高性能
在日语和英语的各项基准测试中均取得优异成绩

Model Capabilities

日语文本生成
英语文本生成
机器翻译
问答系统
代码生成
文本摘要
数学推理

Use Cases

内容创作
日语故事创作
生成符合日语文化背景的创意故事
如示例中生成的燕与羊驼的温馨故事
教育
日语学习辅助
帮助学习者理解和生成日语内容
商业应用
日语客服机器人
构建日语环境下的智能客服系统
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase