D

Deepseek Coder V2 Lite Instruct FP8

RedHatAIによって開発
DeepSeek-Coder-V2-Lite-InstructのFP8量子化バージョンで、英語の商用および研究用途に適しており、推論効率が最適化されています。
ダウンロード数 11.29k
リリース時間 : 7/17/2024

モデル概要

このモデルはDeepSeek-Coder-V2-Lite-Instructの量子化バージョンで、FP8重み量子化と活性化量子化により最適化されており、アシスタントのようなチャットシナリオに適しています。

モデル特徴

FP8量子化
重みと活性化をFP8データ型に量子化し、ディスクサイズとGPUメモリ要件を約50%削減します。
効率的な推論
vLLM >= 0.5.2を使用した効率的な推論に適しており、推論速度が最適化されています。
高精度
HumanEval+ベンチマークで優れた性能を発揮し、非量子化モデルと比較して同等の精度を維持しています。

モデル能力

テキスト生成
コード生成
チャットアシスタント

使用事例

商用および研究
コード生成アシスタント
開発者がコードスニペットを生成するのを支援し、開発効率を向上させます。
HumanEval+ベンチマークでの平均スコアは79.60です。
チャットボット
アシスタントのようなチャットシナリオに適しており、自然言語インタラクションを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase