M

Mythomax L2 13B AWQ

TheBlokeによって開発
MythoMax L2 13BのAWQ量子化バージョンで、推論効率を効果的に向上させることができます。
ダウンロード数 1,555
リリース時間 : 9/19/2023

モデル概要

これはGrypheのMythoMax L2 13Bモデルに基づくAWQ量子化バージョンで、主に高効率推論タスクに使用されます。

モデル特徴

高効率量子化
AWQ量子化方法を採用し、4ビット量子化をサポートし、GPTQと比較してTransformerベースのより高速な推論を提供します。
多プラットフォームサポート
連続バッチ処理サーバーvLLMをサポートし、多ユーザーサーバーシナリオで高スループットの並行推論を実現できます。
多形式利用可能
AWQ、GPTQ、GGUFなどの複数量子化形式のモデルファイルと、元の量子化されていないfp16モデルを提供します。

モデル能力

テキスト生成
高効率推論
多ユーザー並行処理

使用事例

テキスト生成
対話生成
自然言語対話の返信を生成するために使用されます。
流暢で首尾一貫した対話内容を生成します。
コンテンツ作成
執筆支援、ストーリー生成などの創造的なコンテンツ作成に使用されます。
創造性に富んだテキストコンテンツを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase