S

Shisa V1 Llama3 8b

Developed by shisa-ai
基于Meta-Llama-3-8B-Instruct微调的日语优化大语言模型,在多个日语基准测试中表现优异
Downloads 28
Release Time : 5/21/2024

Model Overview

这是一个针对日语优化的8B参数大语言模型,基于Llama 3架构微调,在ELYZA100、日语MT-Bench等日语评估基准上取得良好成绩

Model Features

日语优化
专门针对日语任务进行优化,日语字符占比达91%以上
多基准表现优异
在ELYZA100、日语MT-Bench、Rakuda等多个日语评估基准上超越同类模型
精细调优
通过不同学习率实验确定8e-6为最优参数,避免过拟合

Model Capabilities

日语文本生成
日语问答
日语文本理解
多轮对话

Use Cases

日语NLP应用
日语客服机器人
用于处理日语客户咨询
在Rakuda基准上得分7.05,优于多数同类模型
日语内容创作
生成符合日语表达习惯的文本内容
日语字符占比91.3%,表达自然度较高
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase