M

Meta Llama 3.1 8B Instruct FP8

RedHatAIによって開発
Meta-Llama-3.1-8B-InstructのFP8量子化バージョンで、多言語の商用・研究用途に適しており、アシスタントのようなチャットシナリオに特に最適化されています。
ダウンロード数 361.53k
リリース時間 : 7/23/2024

モデル概要

このモデルはMeta-Llama-3.1-8B-InstructのFP8量子化バージョンで、各パラメータのビット数を16から8に減らすことで、ディスクサイズとGPUメモリ要件を大幅に削減しました。多言語テキスト生成タスクに適しています。

モデル特徴

FP8量子化
重みと活性化をFP8データ型に量子化し、メモリ要件とディスク使用量を大幅に削減。
多言語サポート
英語、ドイツ語、フランス語、イタリア語など、複数の言語をサポート。
効率的な推論
vLLMバックエンド向けに最適化され、効率的な推論性能を提供。

モデル能力

テキスト生成
多言語サポート
チャットアシスタント

使用事例

チャットアシスタント
多言語チャットボット
複数の言語をサポートするチャットボットの構築に使用可能で、自然で流暢な会話体験を提供。
商用アプリケーション
カスタマーサポート
多言語の顧客問い合わせを処理する自動化カスタマーサポートシステムに使用。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase