L

Llm Jp 3.1 1.8b

Developed by llm-jp
LLM-jp-3.1-1.8b是由日本國立情報學研究所開發的大語言模型,基於LLM-jp-3系列,融入指令預訓練增強指令遵循能力。
Downloads 572
Release Time : 5/27/2025

Model Overview

LLM-jp-3.1-1.8b是一個基於Transformer架構的大語言模型,支持多語言處理,特別優化了日語和英語的指令遵循能力。

Model Features

指令預訓練增強
在訓練中期融入指令預訓練,顯著提升模型的指令遵循能力
多語言支持
支持日語、英語、中文、韓語等多種語言處理
參數規模可選
提供不同參數規模的模型版本,滿足不同計算需求

Model Capabilities

日語文本生成
英語文本生成
多語言翻譯
指令理解與執行
代碼生成

Use Cases

自然語言處理
日語問答系統
構建基於日語的智能問答應用
在日語MT Bench評估中獲得6.30分
多語言翻譯
支持日語與英語、中文等語言之間的翻譯
代碼輔助
代碼生成
根據自然語言描述生成代碼片段
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase