モデル選定

CPU効率的推論

# CPU効率的推論

Josiefied Qwen3 8B Abliterated V1 GGUF

Qwen3-8Bをベースにした量子化バージョンで、IQ-DynamicGate超低ビット量子化技術を採用し、メモリ効率と推論速度を最適化

大規模言語モデル

GLM Z1 9B 0414 GGUF

GLM-Z1-9B-0414 は中英バイリンガルのテキスト生成モデルで、GGUFフォーマットを採用し、BF16から超低ビット量子化（1-2ビット）までの複数の量子化レベルに対応しています。

大規模言語モデル複数言語対応

Olympiccoder 7B GGUF

OlympicCoder-7BはQwen2.5-Coder-7B-Instructを最適化したコード生成モデルで、IQ-DynamicGate超低ビット量子化技術を採用し、メモリ制約環境向けに設計されています。

大規模言語モデル英語

Deepcoder 14B Preview GGUF

IQ-DynamicGate技術を採用した超低位量子化(1-2ビット)モデルで、メモリ制約のあるデバイスやエッジコンピューティングシナリオに適しています

大規模言語モデル英語

Orpheus 3b 0.1 Ft GGUF

Llama-3-8Bアーキテクチャを基に最適化された超低ビット量子化モデル。IQ-DynamicGate技術により1-2ビット精度の適応的量子化を実現し、メモリ制約環境に適しています。

大規模言語モデル英語

Llama 3.1 Nemotron Nano 8B V1 GGUF

Llama-3アーキテクチャに基づく8Bパラメータモデルで、IQ-DynamicGate超低ビット量子化技術によりメモリ使用を最適化

大規模言語モデル英語

Mistral Small 3.1 24B Instruct 2503 GGUF

これはMistral-Small-3.1-24B-Base-2503を基にした命令微調整モデルで、GGUFフォーマットとIQ-DynamicGate超低ビット量子化技術を採用しています。

大規模言語モデル複数言語対応

Llama 3.1 8B Instruct GGUF

Llama-3.1-8B-Instruct は Llama-3-8B の命令調整バージョンで、IQ-DynamicGate 技術を用いた超低ビット量子化（1-2 ビット）を採用し、メモリ効率を維持しながら精度を向上させています。

大規模言語モデル複数言語対応

Mistral 7B Instruct V0.2 GGUF

Mistral-7B-Instruct-v0.2はMistral-7Bアーキテクチャに基づく命令微調整モデルで、テキスト生成タスクをサポートし、IQ-DynamicGate超低ビット量子化技術によりメモリ効率を最適化しています。

大規模言語モデル

Tiny Image Captioning

bert-tinyとvit-smallに基づく軽量な画像説明生成モデルで、わずか100MBの重さで、CPU上で非常に高速に動作します。

画像生成テキスト

Transformers 英語

Mini Image Captioning

bert-miniとvit-smallに基づく軽量画像キャプション生成モデルで、わずか130MBの重さで、CPU上で非常に高速に動作します。

画像生成テキスト

Transformers 英語

Bge Base En V1.5 Gguf

このプロジェクトは、GGUF形式で保存されたBGE埋め込みモデルを提供し、llama.cppとの併用に適しており、transformersよりも優れたパフォーマンスを提供します。

テキスト埋め込み

Llama 2 7Bを微調整したReLU活性化スパース大規模言語モデル、動的パラメータ選択により計算効率を向上

大規模言語モデル

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase