G

Gemma 2 Llama Swallow 9b It V0.1

由tokyotech-llm開發
Gemma-2-Llama-Swallow系列模型是在Gemma-2基礎上進行持續預訓練構建的多語言大模型,特別增強了日語能力。
下載量 2,491
發布時間 : 4/23/2025

模型概述

該模型在保留英文能力的同時,通過約2000億標記的持續預訓練顯著提升了日語處理能力,適用於多語言任務和日語指令任務。

模型特點

多語言能力增強
在保留原英文能力基礎上,顯著提升了日語處理能力
大規模持續預訓練
使用約2000億標記數據進行持續預訓練,包含日語網絡語料、維基百科等內容
指令微調優化
在專門構建的日語合成數據上進行有監督微調,提升指令任務表現

模型能力

日語文本生成
英語文本生成
多輪對話
機器翻譯
數學推理
代碼生成

使用案例

語言處理
日語對話系統
構建日語智能助手
在日語MT-Bench中獲得0.759分
多語言內容生成
生成日語和英語內容
教育
日語學習輔助
幫助學習者練習日語
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase