E

EZO2.5 Gemma 3 12b It Preview

由AXCXEPT開發
基於google/gemma-3-12b-it模型,通過EZO訓練方法提升日語性能的文本生成模型
下載量 39
發布時間 : 4/14/2025

模型概述

該模型結合GRPO和PPO概念,使用EZO訓練方法在有限數據集和計算資源下顯著提升了基礎模型的日語文本生成能力

模型特點

高效訓練方法
使用EZO訓練方法結合GRPO/PPO概念,僅需3000數據集和2小時×H200×8臺的訓練條件即可顯著提升性能
高性能日語處理
在Japanese MT Bench和Elyza Tasks100基準測試中表現優異,部分指標接近32B和72B模型
資源高效
可在單塊A40 GPU上運行,適合有限計算資源的環境

模型能力

日語文本生成
數學問題解答
長文本處理

使用案例

教育
數學問題解答
解決複雜的數學應用題
可準確解答包含多變量的數學問題
內容創作
日語文本生成
生成高質量的日語文本內容
生成流暢自然的日語文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase