L

Llm Jp 3.1 1.8b Instruct4

由 llm-jp 开发
由日本国立情报学研究所开发的大语言模型,基于LLM-jp-3构建,通过指令预训练技术显著提升了遵循指令的能力。
下载量 165
发布时间 : 5/27/2025

模型简介

LLM-jp-3.1系列模型是基于Transformer的语言模型,支持多种语言处理,包括日语、英语、中文、韩语等,具备强大的指令遵循能力。

模型特点

指令遵循能力强
通过融入指令预训练技术,显著提升了模型遵循指令的能力。
多语言支持
支持多种语言的处理,包括日语、英语、中文、韩语等。
多架构选择
提供了密集模型和MoE模型等不同架构的选择。

模型能力

文本生成
指令遵循
多语言处理
自然语言理解

使用案例

自然语言处理
问答系统
用于构建多语言问答系统,回答用户提出的各种问题。
在MT Bench评估中,日语得分6.30,英语得分5.70。
指令执行
能够理解和执行复杂的自然语言指令,适用于自动化任务处理。
在AnswerCarefully-Eval评估中,接受率64.7%,违规率24.3%。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase