Qwen3 235B A22B Exl2
Qwen3-235B-A22BのExllamav2量子化バージョンで、複数の量子化精度オプションを提供し、効率的なテキスト生成タスクに適しています。
ダウンロード数 53
リリース時間 : 5/2/2025
モデル概要
Qwen3-235B-A22B大規模言語モデルを基にしたExllamav2量子化バージョンで、異なるビット幅の量子化設定をサポートし、効率的な推論が必要なテキスト生成シナリオに適しています。
モデル特徴
多精度量子化サポート
2.25bpw、3.00bpw、4.00bpwの3種類の量子化精度オプションを提供し、様々なシナリオでの精度と効率のニーズに対応
効率的な推論
Exllamav2量子化技術により、大規模モデルのより効率的な推論を実現
最先端技術サポート
Exllamav2開発ブランチの最新量子化技術を使用(commit 68976a0)
モデル能力
テキスト生成
大規模言語モデル推論
使用事例
テキスト生成
コンテンツ作成
記事やストーリーなどの自動生成に使用
対話システム
インテリジェントな対話アシスタントの構築
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98