L

Llm Jp 3.1 1.8b

由llm-jp開發
LLM-jp-3.1-1.8b是由日本國立情報學研究所開發的大語言模型,基於LLM-jp-3系列,融入指令預訓練增強指令遵循能力。
下載量 572
發布時間 : 5/27/2025

模型概述

LLM-jp-3.1-1.8b是一個基於Transformer架構的大語言模型,支持多語言處理,特別優化了日語和英語的指令遵循能力。

模型特點

指令預訓練增強
在訓練中期融入指令預訓練,顯著提升模型的指令遵循能力
多語言支持
支持日語、英語、中文、韓語等多種語言處理
參數規模可選
提供不同參數規模的模型版本,滿足不同計算需求

模型能力

日語文本生成
英語文本生成
多語言翻譯
指令理解與執行
代碼生成

使用案例

自然語言處理
日語問答系統
構建基於日語的智能問答應用
在日語MT Bench評估中獲得6.30分
多語言翻譯
支持日語與英語、中文等語言之間的翻譯
代碼輔助
代碼生成
根據自然語言描述生成代碼片段
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase