L

Llama 3 Swallow 8B Instruct V0.1

由tokyotech-llm開發
基於Meta Llama 3構建的日語優化大語言模型,通過持續預訓練增強日語能力,採用監督微調提升指令跟隨能力
下載量 13.88k
發布時間 : 6/26/2024

模型概述

Llama3 Swallow是基於Llama 3系列進行持續預訓練的日語優化模型,主要增加了日語數據並採用SFT微調,支持日語和英語的多語言任務處理

模型特點

日語優化
通過持續預訓練增強日語處理能力,在日語基準測試中表現優異
多語言支持
同時支持日語和英語,能處理跨語言任務
指令微調
採用監督微調(SFT)和聊天向量技術,提升指令跟隨能力
高性能
在日語和英語的各項基準測試中均取得優異成績

模型能力

日語文本生成
英語文本生成
機器翻譯
問答系統
代碼生成
文本摘要
數學推理

使用案例

內容創作
日語故事創作
生成符合日語文化背景的創意故事
如示例中生成的燕與羊駝的溫馨故事
教育
日語學習輔助
幫助學習者理解和生成日語內容
商業應用
日語客服機器人
構建日語環境下的智能客服系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase