G

Gemma 2 Llama Swallow 27b It V0.1

由tokyotech-llm開發
基於Gemma-2架構的日語增強大語言模型,通過持續預訓練顯著提升日語能力,同時保留原版英語能力
下載量 27
發布時間 : 4/24/2025

模型概述

該模型是對Google Gemma-2進行持續預訓練構建的系列模型之一,特別針對日語處理能力進行了優化,適用於日英雙語文本生成和理解任務

模型特點

雙語能力增強
在保留原版Gemma 2英語能力的同時,顯著增強了日語處理能力
大規模預訓練
使用約2000億tokens的混合語料進行持續預訓練,包含專業日語語料
指令微調優化
採用針對日語特別構建的合成數據進行監督式微調(SFT)

模型能力

日語文本生成
英語文本生成
日英雙語理解
多輪對話處理
代碼生成

使用案例

語言服務
日語聊天助手
構建流暢自然的日語對話系統
在日語MT-Bench評測中表現優異
日英翻譯
實現高質量的日英互譯
在WMT20評測基準上有競爭力表現
教育
日語學習輔助
幫助非日語母語者學習日語
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase