L

Llama 2 13B GPTQ

TheBlokeによって開発
MetaのLlama 2 13BモデルのGPTQ量子化バージョンで、効率的な推論に適しています。
ダウンロード数 538
リリース時間 : 7/18/2023

モデル概要

これはMetaのLlama 2 13BモデルのGPTQ量子化バージョンで、TheBlokeによって提供されています。このモデルは量子化処理が施されており、高い推論品質を維持しながら計算リソースの必要量を削減することができます。

モデル特徴

効率的な推論
GPTQ量子化技術により、高い推論品質を維持しながら計算リソースの必要量を削減します。
複数の量子化オプション
4ビットと8ビットの量子化バージョン、および異なるグループサイズと活性化順序のオプションを提供し、さまざまなハードウェア要件を満たします。
ExLlama互換性
4ビット量子化バージョンはExLlama推論フレームワークと互換性があります。

モデル能力

テキスト生成
対話システム
コンテンツ作成

使用事例

コンテンツ生成
記事作成
高品質の記事やブログコンテンツを生成します。
対話システム
スマートチャットボットを構築します。
研究と開発
NLP研究
自然言語処理関連の研究に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase