L

Llama 3.3 Swallow 70B V0.4

由tokyotech-llm開發
Llama 3.3 Swallow是一個700億參數的大語言模型,基於Meta Llama 3.3構建,增強了日語能力同時保留英文能力。
下載量 1,950
發布時間 : 2/17/2025

模型概述

Llama 3.3 Swallow通過在Meta Llama 3.3模型上進行持續預訓練而構建,使用大規模日語和英語語料庫增強雙語處理能力。

模型特點

雙語能力增強
在保留英文能力的基礎上,顯著提升了日語處理能力。
持續預訓練
使用大規模多樣化的語料進行持續預訓練,提升模型性能。
多種模型變體
提供不同版本和規格的模型,滿足不同需求。

模型能力

日語文本生成
英語文本生成
機器翻譯
問答系統
代碼生成
數學推理

使用案例

教育
日語學習輔助
幫助學生理解和生成日語文本。
在日語評估基準中表現優異。
翻譯
日英互譯
用於日英和英日機器翻譯任務。
在WMT20翻譯任務中表現良好。
編程
代碼生成
生成符合Google Python風格指南的代碼。
在JHumanEval評估中表現優異。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase