T

Tanuki 8x8B Dpo V1.0

由weblab-GENIAC開發
Tanuki-8x8B是從零開始預訓練的大規模語言模型,通過SFT和DPO針對對話任務進行了優化
下載量 217
發布時間 : 8/12/2024

模型概述

Tanuki-8x8B-dpo-v1.0是一個參數規模為8x8B(總參數約47B,活躍參數約13B)的大規模語言模型,預訓練數據量約1.7T tokens,專門針對日語和英語的對話任務進行了優化。

模型特點

混合專家架構
採用8x8B的混合專家架構,總參數約47B但活躍參數僅約13B,平衡了性能與效率
日語優化
專門針對日語對話任務進行了優化,支持高質量的日語文本生成
DPO優化
通過監督微調(SFT)和直接偏好優化(DPO)提升了對話質量
多量化支持
提供AWQ、GPTQ等多種量化版本,便於不同硬件環境部署

模型能力

日語文本生成
英語文本生成
多輪對話
任務導向對話

使用案例

智能助手
日語問答系統
構建針對日語用戶的智能問答助手
在人工評估中表現優異
教育
日語學習輔助
幫助日語學習者進行語言練習
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase