モデル選定

高スループット

# 高スループット

Deepseek R1 0528 AWQ

DeepSeek R1 0528のAWQ量子化モデルで、vLLMを使用して8基の80GB GPUでフルコンテキスト長で実行可能です。

大規模言語モデル

Transformers 複数言語対応

cognitivecomputations

Deepseek R1 Distill Qwen 32B Quantized.w8a8

DeepSeek-R1-Distill-Qwen-32Bの量子化バージョン。INT8の重み量子化と活性化量子化により、メモリ要件を削減し、計算効率を向上させます。

大規模言語モデル

Deepseek R1 AWQ

DeepSeek R1モデルのAWQ量子化バージョン、float16オーバーフロー問題を最適化し、効率的な推論デプロイをサポート

大規模言語モデル

Transformers 複数言語対応

cognitivecomputations

Fastapply 1.5B V1.0

FastApply-1.5B-v1.0は1.5Bパラメータのモデルで、リアルタイムコードアプリケーション向けに設計されており、完全なファイル編集を生成でき、SoftGen AIをサポートします。

大規模言語モデル

Transformers 英語

Mambavision T2 1K

MambaとTransformerの利点を組み合わせた初のコンピュータビジョンハイブリッドモデルで、Mambaの式を再設計して視覚特徴モデリング能力を強化し、Mambaアーキテクチャにセルフアテンションモジュールを組み込むことで長距離空間依存関係のモデリングを向上させています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase