L

Llama 3.3 Swallow 70B V0.4

Developed by tokyotech-llm
Llama 3.3 Swallow是一個700億參數的大語言模型,基於Meta Llama 3.3構建,增強了日語能力同時保留英文能力。
Downloads 1,950
Release Time : 2/17/2025

Model Overview

Llama 3.3 Swallow通過在Meta Llama 3.3模型上進行持續預訓練而構建,使用大規模日語和英語語料庫增強雙語處理能力。

Model Features

雙語能力增強
在保留英文能力的基礎上,顯著提升了日語處理能力。
持續預訓練
使用大規模多樣化的語料進行持續預訓練,提升模型性能。
多種模型變體
提供不同版本和規格的模型,滿足不同需求。

Model Capabilities

日語文本生成
英語文本生成
機器翻譯
問答系統
代碼生成
數學推理

Use Cases

教育
日語學習輔助
幫助學生理解和生成日語文本。
在日語評估基準中表現優異。
翻譯
日英互譯
用於日英和英日機器翻譯任務。
在WMT20翻譯任務中表現良好。
編程
代碼生成
生成符合Google Python風格指南的代碼。
在JHumanEval評估中表現優異。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase