モデル選定

エッジコンピューティング最適化

# エッジコンピューティング最適化

Devstral Small 2505 GGUF

Devstral-Small-2505の量子化バージョン、さまざまなハードウェア要件に対応するための複数の精度オプションを提供

大規模言語モデル複数言語対応

Japanese Reranker Tiny V2

これは非常にコンパクトで高速な日本語リランキングモデルで、RAGシステムの精度向上に適しており、CPUやエッジデバイス上でも効率的に動作します。

テキスト埋め込み日本語

GLM Z1 9B 0414 GGUF

GLM-Z1-9B-0414 は中英バイリンガルのテキスト生成モデルで、GGUFフォーマットを採用し、BF16から超低ビット量子化（1-2ビット）までの複数の量子化レベルに対応しています。

大規模言語モデル複数言語対応

Granite 3.3 8b Instruct GGUF

IQ-DynamicGate技術を採用した超低ビット量子化(1-2ビット)言語モデル、メモリ制約環境に適応

大規模言語モデル

Falcon E 3B Instruct

Falcon-E-3B-Instructは1.58ビットアーキテクチャに基づく高効率な言語モデルで、エッジデバイス向けに最適化されており、優れた推論能力と低メモリ消費を特徴とします。

大規模言語モデル

Falcon E 1B Instruct

Falcon-E-1B-Instructは、1.58ビットアーキテクチャに基づく効率的な言語モデルで、エッジデバイス向けに最適化されており、低メモリ使用量と高性能を特徴としています。

大規模言語モデル

Falcon E 1B Base

Falcon-E-1B-Base はTIIによって開発された効率的な1.58ビット言語モデルで、純粋なTransformerアーキテクチャを採用し、エッジデバイス向けに最適化されています。

大規模言語モデル

Meta Llama 3 8B Instruct GGUF

Llama-3-8B-InstructベースのIQ-DynamicGate超低ビット量子化(1-2ビット)モデルで、精度適応量子化技術を採用し、極限のメモリ効率を維持しながら推論精度を向上させます。

大規模言語モデル英語

Glm Edge V 5b Gguf

Glm-Edge-V-5B-GGUFは、中英多言語対応の画像テキスト生成モデルで、GLMアーキテクチャに基づいて開発されました。

大規模言語モデル複数言語対応

FLUX.1 Canny Dev GGUF

FLUX.1-Canny-dev はテキストから画像を生成するモデルで、画像生成タスクに特化しています。

テキスト生成画像英語

GLM-Edge-V-2BはPytorchフレームワークに基づく画像テキストからテキストへのモデルで、中国語処理をサポートしています。

画像生成テキスト

TinyLlama-1.1B-Chat-v1.0をベースにした混合モデルで、軽量なLLMソリューションを提供

大規模言語モデル

MIT Ast Finetuned Speech Commands V2 Ov

これはMIT/ast-finetuned-speech-commands-v2を変換したOpenVINO最適化バージョンで、音声コマンド認識タスクの推論処理を高速化します。

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase