Q

Qwen3 235B A22B FP8 Dynamic

Developed by RedHatAI
Qwen3-235B-A22BモデルのFP8量子化バージョンで、GPUメモリの要件を効果的に削減し、計算スループットを向上させ、さまざまな自然言語処理シナリオに適しています。
Downloads 2,198
Release Time : 5/4/2025

Model Overview

このモデルはQwen3-235B-A22BモデルをFP8量子化したバージョンで、GPUメモリの要件を効果的に削減し、計算スループットを向上させ、推論や関数呼び出しなどのさまざまな自然言語処理シナリオに使用できます。

Model Features

FP8量子化
活性化と重みに対してFP8量子化を行い、GPUメモリの要件を約50%削減し、行列乗算の計算スループットを約2倍に向上させ、ディスクサイズの要件を約50%削減します。
効率的なデプロイ
vLLMバックエンドを使用した効率的なデプロイをサポートし、OpenAIサービスと互換性があります。
高性能
複数のベンチマークテストで優れた性能を発揮し、正解率の回復率はほぼ100%です。

Model Capabilities

テキスト生成
関数呼び出し
多言語命令追従
翻訳

Use Cases

自然言語処理
推論
テキスト生成や質問応答などの推論タスクに使用します。
関数呼び出し
関数呼び出し機能をサポートし、複雑なアプリケーションの構築に使用できます。
翻訳
多言語翻訳タスクをサポートします。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase