モデル選定

低VRAM消費

# 低VRAM消費

Qwen3 Reranker 4B W4A16 G128

これはQwen/Qwen3-Reranker-4BをGPTQ量子化した成果で、VRAM使用量を大幅に削減しました。

大規模言語モデル

Qwen3 Embedding 4B W4A16 G128

これはGPTQ量子化を施したQwen3-Embedding-4Bモデルで、VRAM使用量が大幅に削減され、性能損失が少ない。

テキスト埋め込み

Optical Flow MEMFOF Tartan T TSKH

MEMFOFは、全高清ビデオ向けに設計されたメモリ効率の良いオプティカルフロー推定方法で、高精度と低VRAM使用量を兼ね備えています。

現在最速のデンマーク語ASRモデルで、hviske-v2の蒸留版です。速度は約4倍向上しつつ、精度は維持されています。

音声認識その他

4ビットTransformerとT5エンコーダーを採用したFluxモデルで、テキストから画像生成タスクに使用され、非商用利用をサポートします。

テキスト生成画像

Mlx FLUX.1 Schnell 4bit Quantized

MLXフレームワークで最適化された4ビット量子化テキスト生成画像モデル、効率的な画像生成をサポート

テキスト生成画像英語

Distil Whisper Large V3 Es

Whisper v3大規模モデルを蒸留したスペイン語音声認識モデル、SandboxAIとUniversidad Nacional de Rio Negroの共同開発

Transformers スペイン語

Photonは安定拡散技術に基づくテキストから画像を生成するモデルで、高品質な画像生成に特化しています。

RWKVはRNNとTransformerの利点を組み合わせた大規模言語モデルで、効率的なトレーニングと高速な推論をサポートし、無限のコンテキスト長処理能力を備えています。

大規模言語モデル

Guanaco 7b Leh V2

LLaMA 7Bベースの多言語コマンドフォロー言語モデルで、英語、中国語、日本語をサポートし、チャットボットやコマンドフォロー任務に適しています。

大規模言語モデル

Transformers 複数言語対応

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase