モデル選定

混合精度量子化

# 混合精度量子化

Deepseek R1 0528 GPTQ Int4 Int8Mix Compact

DeepSeek-R1-0528モデルのGPTQ量子化バージョンで、Int4 + 選択的Int8の量子化方式を採用し、生成品質を保ちながらファイルサイズを縮小します。

大規模言語モデル

Qwen3 235B A22B Mixed 3 6bit

これはQwen/Qwen3-235B-A22Bモデルを変換した混合3-6ビット量子化バージョンで、Apple MLXフレームワーク向けの効率的な推論に適しています。

大規模言語モデル

Gemma 3 4b It Abliterated GGUF

革新的な量子化手法により、より小さなモデルサイズと高性能を両立

大規模言語モデル英語

FLUX.1 Dev Q8 Fp16 Fp32 Mix 8 To 32 Bpw Gguf

Flux.1-devの実験的なGGUFフォーマット変換バージョンで、複数の混合精度量子化スキームを含む

テキスト生成画像

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase