L

Llama 3 Swallow 8B Instruct V0.1

由 tokyotech-llm 开发
基于Meta Llama 3构建的日语优化大语言模型,通过持续预训练增强日语能力,采用监督微调提升指令跟随能力
下载量 13.88k
发布时间 : 6/26/2024

模型简介

Llama3 Swallow是基于Llama 3系列进行持续预训练的日语优化模型,主要增加了日语数据并采用SFT微调,支持日语和英语的多语言任务处理

模型特点

日语优化
通过持续预训练增强日语处理能力,在日语基准测试中表现优异
多语言支持
同时支持日语和英语,能处理跨语言任务
指令微调
采用监督微调(SFT)和聊天向量技术,提升指令跟随能力
高性能
在日语和英语的各项基准测试中均取得优异成绩

模型能力

日语文本生成
英语文本生成
机器翻译
问答系统
代码生成
文本摘要
数学推理

使用案例

内容创作
日语故事创作
生成符合日语文化背景的创意故事
如示例中生成的燕与羊驼的温馨故事
教育
日语学习辅助
帮助学习者理解和生成日语内容
商业应用
日语客服机器人
构建日语环境下的智能客服系统
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase