L

Llama 3.1 Swallow 8B Instruct V0.2

由 tokyotech-llm 开发
Llama 3.1 Swallow是基于Meta Llama 3.1模型进行持续预训练的大语言模型系列,增强了日语能力同时保留英文能力。
下载量 2,283
发布时间 : 10/30/2024

模型简介

Llama 3.1 Swallow是通过在Meta Llama 3.1模型上进行持续预训练构建的大语言模型系列,专注于增强日语能力同时保持英文能力。8B和70B两种参数规模可选,适用于多语言文本生成和理解任务。

模型特点

多语言能力增强
在保留英文能力的同时,显著提升了日语语言处理能力
持续预训练
基于Meta Llama 3.1模型进行约2000亿标记的持续预训练
指令微调优化
使用专门构建的日语合成数据进行监督微调,提高指令遵循能力
性能平衡
在日语和英语任务上都保持了较高的性能水平

模型能力

日语文本生成
英语文本生成
多轮对话
机器阅读理解
自动摘要
机器翻译
数学推理
代码生成

使用案例

内容创作
日语故事创作
生成符合日语文化背景的创意故事
能生成富有日本文化特色的连贯故事
技术文档撰写
用日语或英语撰写技术文档
可生成结构清晰的技术内容
语言服务
日英机器翻译
在日语和英语之间进行文本翻译
在WMT20评估中表现良好
日语问答系统
构建日语问答和客服机器人
在日语问答任务中取得高准确率
教育辅助
日语学习助手
帮助非日语母语者学习日语
能解释语法和文化背景
数学问题解答
解答日语或英语的数学问题
在MGSM数学推理评估中表现良好
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase