H

Hunyuan 7B Instruct 0124

Developed by tencent
混元-7Bは騰訊が公開したオープンソースの大規模言語モデルで、256Kの長テキスト処理能力とグループ化クエリ注意力メカニズム(GQA)を持ち、中国語7Bの稠密モデルで優れた性能を発揮します。
Downloads 590
Release Time : 1/24/2025

Model Overview

混元-7Bモデルは騰訊が開発した大規模言語モデルで、中国語処理能力に特化しており、計算リソースと性能のバランスが良いです。

Model Features

256K長テキスト処理
長テキスト処理能力を256Kまで拡張し、長文書や複雑なコンテキストの処理に適しています。
グループ化クエリ注意力メカニズム
GQA(Grouped Query Attention)メカニズムを採用し、モデルの効率を向上させます。
高性能推論
vLLMとTensorRT - LLMの2種類の推論バックエンドを選択でき、推論速度を最適化します。
中国語最適化
中国語タスクに対して特別な最適化を行い、中国語のベンチマークテストで優れた性能を発揮します。

Model Capabilities

テキスト生成
質問応答システム
コード生成
数学的推論
知識質問応答
長テキスト理解

Use Cases

教育
スマートチューター
学生が様々な学科の問題を解くのを支援します。
数学的推論(GSM8K)テストで93.33%の正解率を達成しました。
研究
学術論文分析
長い学術論文の処理と分析を行います。
256Kのコンテキスト長をサポートします。
ビジネス
スマートカスタマーサービス
顧客の問い合わせと問題解決を処理します。
中国語の質問応答テストで優れた性能を発揮します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase