G

Gemma 2 Llama Swallow 2b It V0.1

由tokyotech-llm開發
Gemma-2-Llama-Swallow系列是通過對gemma-2模型進行持續預訓練構建的,顯著增強了日文語言處理能力,同時保留原有英文能力。
下載量 61
發布時間 : 4/21/2025

模型概述

基於Gemma 2模型構建的多語言大語言模型,專注於增強日語處理能力,同時保持英語能力。適用於文本生成任務。

模型特點

雙語能力增強
在保留原有英文能力的同時,顯著增強了日文語言處理能力
大規模預訓練
使用約2000億token的日文網絡語料、日英維基百科條目等混合數據進行持續預訓練
指令微調版本
提供專門為日語構建的合成數據進行監督式微調(SFT)的指令微調版本
多參數規模選擇
提供2B、9B和27B三種參數規模的模型變體

模型能力

日語文本生成
英語文本生成
多輪對話
指令理解與執行

使用案例

對話系統
日語客服機器人
用於構建日語客戶服務對話系統
內容生成
日語文章創作
生成日語文章、報告等內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase