T

Tanuki 8x8B Dpo V1.0

Developed by weblab-GENIAC
Tanuki-8x8Bはゼロから事前学習された大規模言語モデルで、SFTとDPOを通じて対話タスクに対して最適化されています。
Downloads 217
Release Time : 8/12/2024

Model Overview

Tanuki-8x8B-dpo-v1.0はパラメータ規模が8x8B(総パラメータ約47B、アクティブパラメータ約13B)の大規模言語モデルで、事前学習データ量は約1.7Tトークンで、日本語と英語の対話タスクに特化して最適化されています。

Model Features

ハイブリッドエキスパートアーキテクチャ
8x8Bのハイブリッドエキスパートアーキテクチャを採用し、総パラメータは約47Bですが、アクティブパラメータは約13Bのみで、性能と効率をバランスさせています。
日本語最適化
日本語対話タスクに特化して最適化されており、高品質な日本語テキスト生成をサポートします。
DPO最適化
教師付き微調整(SFT)と直接嗜好最適化(DPO)を通じて対話品質を向上させました。
多量化サポート
AWQ、GPTQなどの複数量化バージョンを提供し、異なるハードウェア環境でのデプロイを容易にします。

Model Capabilities

日本語テキスト生成
英語テキスト生成
マルチラウンド対話
タスク指向対話

Use Cases

スマートアシスタント
日本語質問応答システム
日本語ユーザー向けのスマート質問応答アシスタントを構築します。
人為的な評価で優れた結果を示しました。
教育
日本語学習支援
日本語学習者の言語練習を支援します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase