L

Llm Jp 3.1 1.8b Instruct4

由llm-jp開發
由日本國立情報學研究所開發的大語言模型,基於LLM-jp-3構建,通過指令預訓練技術顯著提升了遵循指令的能力。
下載量 165
發布時間 : 5/27/2025

模型概述

LLM-jp-3.1系列模型是基於Transformer的語言模型,支持多種語言處理,包括日語、英語、中文、韓語等,具備強大的指令遵循能力。

模型特點

指令遵循能力強
通過融入指令預訓練技術,顯著提升了模型遵循指令的能力。
多語言支持
支持多種語言的處理,包括日語、英語、中文、韓語等。
多架構選擇
提供了密集模型和MoE模型等不同架構的選擇。

模型能力

文本生成
指令遵循
多語言處理
自然語言理解

使用案例

自然語言處理
問答系統
用於構建多語言問答系統,回答用戶提出的各種問題。
在MT Bench評估中,日語得分6.30,英語得分5.70。
指令執行
能夠理解和執行復雜的自然語言指令,適用於自動化任務處理。
在AnswerCarefully-Eval評估中,接受率64.7%,違規率24.3%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase