モデル選定

8ビット量子化推論

# 8ビット量子化推論

Qwen3 30B A3B Gptq 8bit

Qwen3 30B A3BはGPTQメソッドを用いて8ビット量子化処理を施した大規模言語モデルで、効率的な推論シナリオに適しています。

大規模言語モデル

Josiefied Qwen3 8B Abliterated V1 8bit

Qwen3-8Bを最適化した8ビット量子化バージョン、MLXフレームワーク向けの効率的な推論に適応

大規模言語モデル

Kimi VL A3B Thinking 8bit

Kimi-VL-A3B-Thinking-8bitは、MLX形式に変換されたマルチモーダル視覚言語モデルで、画像テキストからテキストへの生成タスクをサポートしています。

画像生成テキスト

Transformers その他

Gemma 3 12b It Qat 8bit

Google Gemma 3 12Bモデルを基に変換された8ビット量子化バージョンで、画像テキストからテキストへのタスクに適しています。

画像生成テキスト

Transformers その他

Llama 4 Scout 17B 16E 8bit

これはMetaのLlama-4-Scout-17B-16Eモデルから変換されたMLX形式のモデルで、多言語と視覚言語タスクをサポートします。

テキスト生成画像

Transformers 複数言語対応

Stable Diffusion 3.5 Large Turbo Openvino 8bit

Stable Diffusion 3.5 Large Turboの8ビット量子化バージョンで、OpenVINO形式に変換され、効率的なテキストから画像生成タスクに使用されます。

テキスト生成画像英語

LLAMA 3 Quantized

Meta Llama 3 - 8B Instruct大規模言語モデルの8ビット量子化バージョン、モデルサイズを縮小し推論速度を向上、リソースが限られたデバイスでの展開に適しています。

大規模言語モデル

Meta Llama 3 8B Instruct Bnb 8bit

これはMeta社のMeta-Llama-3-8B-Instructモデルの8ビット量子化バージョンで、bitsandbytesを使用して量子化されており、効率的なテキスト生成タスクに適しています。

大規模言語モデル

Pinokio_v1.0 は英語とトルコ語をサポートするテキスト生成モデルで、Apache-2.0 ライセンスの下で公開されています。

大規模言語モデル

Transformers 複数言語対応

Instructblip Flan T5 Xxl 8bit Nf4

InstructBLIPはBLIP-2の視覚的指示チューニングバージョンで、視覚と言語モデルを組み合わせ、画像とテキスト指示に基づいて説明を生成したり質問に答えたりできます。

画像生成テキスト

Transformers 英語

Mediocreatmybest

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase