Q

Qwen3 8B AWQ

Qwenによって開発
Qwen3-8B-AWQは通義千問シリーズ最新世代の8.2Bパラメータを持つ大規模言語モデルで、AWQ 4-bit量子化技術を用いて推論効率を最適化しています。思考モードと非思考モードの切り替えをサポートし、優れた推論能力、指示追従能力、エージェント能力を備えています。
ダウンロード数 13.99k
リリース時間 : 5/3/2025

モデル概要

Qwen3-8Bの4-bit量子化バージョンで、モデル性能を維持しながら計算リソース要件を大幅に削減。32Kのコンテキスト長をサポートし、YaRNにより131Kトークンまで拡張可能。

モデル特徴

デュアルモード動的切替
思考モード(複雑な推論)と非思考モード(効率的な対話)をシームレスに切り替え可能。enable_thinkingパラメータまたは/think、/no_thinkコマンドで制御
強化された推論能力
数学、コード生成、論理的推論において前世代モデルを凌駕。思考モードでは特殊なデコード戦略を使用して性能を向上
効率的な量子化
AWQ 4-bit量子化技術を採用し、モデル精度を維持しながらVRAM使用量を75%削減
超長文コンテキスト
ネイティブで32Kトークンをサポート、YaRN技術により131Kトークンの長文処理が可能

モデル能力

複雑な論理的推論
マルチターン対話
コード生成
多言語翻訳
ツール呼び出し
創造的執筆
数学計算

使用事例

インテリジェントアシスタント
パーソナライズド対話
思考モードで深い推論対話を実現、または非思考モードで効率的な日常会話
より自然なインタラクション体験、応答速度40%向上
開発支援
コード補完
強化されたコード理解能力を活用して高品質なコードスニペットを生成
HumanEvalベンチマークでオープンソースモデルのトップレベルを達成
データ分析
長文書処理
YaRN技術を組み合わせて超長技術文書や法律文書を分析
131Kトークンのコンテキスト理解をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase