モデル選定

チャット対話最適化

# チャット対話最適化

GLM 4 32B 0414 4bit DWQ

これはTHUDM/GLM-4-32B-0414モデルのMLXフォーマット版で、4ビットDWQ量子化処理が施されており、Appleチップデバイス向けの効率的な推論に適しています。

大規模言語モデル複数言語対応

Goekdeniz Guelmez Josiefied Qwen3 8B Abliterated V1 GGUF

これはQwen3-8Bモデルの量子化バージョンで、llama.cppを使用してimatrix量子化を行い、チャットシーンに適しています。

大規模言語モデル

Qwen3 30B A3B 4bit DWQ

これはQwen3-30B-A3Bモデルを基にした4ビット量子化バージョンで、6ビット量子化から4ビットに蒸留したカスタムDWQ量子化技術を使用して作成され、テキスト生成タスクに適しています。

大規模言語モデル

Josiefied Qwen3 8B Abliterated V1 8bit

Qwen3-8Bを最適化した8ビット量子化バージョン、MLXフレームワーク向けの効率的な推論に適応

大規模言語モデル

Josiefied Qwen3 4B Abliterated V1 4bit

これはQwen3-4BモデルをMLX形式に変換した4ビット量子化バージョンで、テキスト生成タスクに適しています。

大規模言語モデル

Tesslate Tessa T1 3B GGUF

Tessa-T1-3BはQwen2アーキテクチャに基づく3Bパラメータの大規模言語モデルで、様々なハードウェアニーズに対応するため複数の量子化バージョンを提供します。

大規模言語モデル英語

Pivot 0.1 Early

PiVoTはMistral 7Bをファインチューニングしたモデルで、Synatra v0.3 RPから派生したバリアントであり、良好なパフォーマンスを示しています。

大規模言語モデル

Transformers 複数言語対応

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase