L

Llama 3.1 Swallow 8B Instruct V0.2

由tokyotech-llm開發
Llama 3.1 Swallow是基於Meta Llama 3.1模型進行持續預訓練的大語言模型系列,增強了日語能力同時保留英文能力。
下載量 2,283
發布時間 : 10/30/2024

模型概述

Llama 3.1 Swallow是通過在Meta Llama 3.1模型上進行持續預訓練構建的大語言模型系列,專注於增強日語能力同時保持英文能力。8B和70B兩種參數規模可選,適用於多語言文本生成和理解任務。

模型特點

多語言能力增強
在保留英文能力的同時,顯著提升了日語語言處理能力
持續預訓練
基於Meta Llama 3.1模型進行約2000億標記的持續預訓練
指令微調優化
使用專門構建的日語合成數據進行監督微調,提高指令遵循能力
性能平衡
在日語和英語任務上都保持了較高的性能水平

模型能力

日語文本生成
英語文本生成
多輪對話
機器閱讀理解
自動摘要
機器翻譯
數學推理
代碼生成

使用案例

內容創作
日語故事創作
生成符合日語文化背景的創意故事
能生成富有日本文化特色的連貫故事
技術文檔撰寫
用日語或英語撰寫技術文檔
可生成結構清晰的技術內容
語言服務
日英機器翻譯
在日語和英語之間進行文本翻譯
在WMT20評估中表現良好
日語問答系統
構建日語問答和客服機器人
在日語問答任務中取得高準確率
教育輔助
日語學習助手
幫助非日語母語者學習日語
能解釋語法和文化背景
數學問題解答
解答日語或英語的數學問題
在MGSM數學推理評估中表現良好
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase