L

Llama 3.1 Swallow 8B Instruct V0.3

由tokyotech-llm開發
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
下載量 16.48k
發布時間 : 12/18/2024

模型概述

該模型在Llama 3.1基礎上進行了日語能力的增強,適用於日語和英語的文本生成任務,特別適合需要日語支持的場景。

模型特點

日語能力增強
通過約2000億標記的持續預訓練,顯著提升了日語處理能力。
多語言支持
在增強日語能力的同時,保留了原有的英文能力。
指令微調
通過監督微調構建的指令微調模型,能更好地響應指令。

模型能力

日語文本生成
英語文本生成
多輪對話
指令響應

使用案例

對話系統
日語客服助手
用於日語環境的客戶服務對話系統。
在日語MT-Bench上表現出色
內容創作
日語故事創作
生成日語短篇故事或創意寫作。
能生成連貫的日語敘事
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase