L

Llama 3 Swallow 8B V0.1

由tokyotech-llm開發
基於Meta Llama 3構建的日語增強大語言模型,通過持續預訓練和指令微調提升日語處理能力
下載量 2,230
發布時間 : 5/20/2024

模型概述

Llama3 Swallow是基於Meta Llama 3系列模型進行日語數據增強訓練的變體,包含8B和70B兩種參數規模,支持英語和日語文本生成任務

模型特點

日語能力增強
通過大量日語數據持續預訓練,顯著提升日語任務表現
雙語支持
同時支持英語和日語處理,在雙語任務中表現優異
指令優化版本
提供經過監督微調(SFT)和聊天向量技術優化的指令版本

模型能力

日語文本生成
英語文本生成
機器翻譯
問答系統
代碼生成
數學推理
摘要生成

使用案例

自然語言處理
日語問答系統
構建面向日語用戶的智能問答應用
在JCommonsenseQA基準上達到89.45%準確率
英日機器翻譯
實現高質量英日雙向翻譯
WMT20英日翻譯BLEU得分0.2758
教育應用
日語學習助手
輔助日語學習者進行語言練習和知識查詢
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase