L

Llama 3.3 Swallow 70B Instruct V0.4

由tokyotech-llm開發
Llama 3.3 Swallow是基於Meta Llama 3.3模型進行持續預訓練的大型語言模型(70B),增強了日語能力同時保留原有英語能力。
下載量 874
發布時間 : 4/25/2025

模型概述

通過對Llama 3.3模型進行持續預訓練構建的日語增強型大語言模型,適用於雙語文本生成任務。

模型特點

雙語能力增強
在保留Llama 3.3原有英語能力的基礎上,顯著提升了日語處理能力
大規模持續預訓練
使用約3150億個標記的日語和英語數據進行持續預訓練
指令調優優化
通過對日語構建的合成數據進行監督微調(SFT),提升指令跟隨能力

模型能力

日語文本生成
英語文本生成
雙語翻譯
指令跟隨
代碼生成

使用案例

語言處理
日語內容創作
生成高質量的日語文章、報告等
在JMT-Bench JA評估中獲得0.772平均分
英日雙語翻譯
提供英語和日語之間的互譯服務
WMT20翻譯任務中表現良好
教育
日語學習輔助
為日語學習者提供語法解釋和練習生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase