Qwen3-30B-A3B-gptq-8bitオープンソース大規模言語モデル - 高効率推論シナリオでの無料デプロイの第一選択

ホーム

Qwen3 30B A3B Gptq 8bit

btbtyler09によって開発

Qwen3 30B A3BはGPTQメソッドを用いて8ビット量子化処理を施した大規模言語モデルで、効率的な推論シナリオに適しています。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #8ビット量子化推論 #大規模言語モデル #効率的なデプロイ

ダウンロード数 301

リリース時間 : 5/2/2025

モデル概要

このモデルはQwen3シリーズの30Bパラメータバージョンで、8ビット量子化処理を経ており、性能を維持しながら計算リソース要件を低減することを目的としており、テキスト生成などのタスクに適しています。

モデル特徴

8ビット量子化

GPTQメソッドを用いた8ビット量子化により、モデルサイズとメモリ要件を大幅に低減

効率的な推論

量子化後のモデルはコンシューマーグレードのハードウェアで動作可能で、推論効率を向上

グループ量子化

グループサイズ32のグループ量子化技術を使用し、量子化精度と性能のバランスを実現

モデル能力

テキスト生成

自然言語理解

対話システム

使用事例

コンテンツ生成

クリエイティブライティング

ストーリーや詩などのクリエイティブなテキストコンテンツを生成

インテリジェントアシスタント

対話システム

チャットボットや仮想アシスタントを構築

属性	详情
モデルタイプ	Qwen3 30B A3Bの8ビット量子化モデル
ライブラリ名	transformers
ライセンス	apache-2.0
タグ	qwen3、qwen、gptq、8bit

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Qwen3 30B A3B Gptq 8bit

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Qwen3 30B A3Bモデルの8ビット量子化

🚀 クイックスタート

💻 使用例

基本的な使用法

📚 ドキュメント

モデル情報