モデル選定

FP8効率的推論

# FP8効率的推論

Qwen3 235B A22B FP8

Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、密モデルと混合エキスパート（MoE）モデルの完全なスイートを提供します。大規模なトレーニングに基づき、Qwen3は推論、指示の遵守、エージェント能力、多言語サポートにおいて画期的な進歩を実現しました。

大規模言語モデル

Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、全シリーズの密モデルと混合専門家（MoE）モデルを提供し、推論、命令追従、エージェント能力、多言語サポートにおいて画期的な進展を遂げています。

大規模言語モデル

Qwen3-4B-FP8は通義千問シリーズ最新の大規模言語モデルで、40億パラメータのFP8量子化バージョンを提供し、思考モードと非思考モードの切り替えをサポートし、推論、指示追従、エージェント能力において優れた性能を発揮します。

大規模言語モデル

Tencent Hunyuanビデオモデルを基にしたアニメスタイルアダプターで、高品質なテキストからビデオ生成能力を提供し、特にアニメスタイルのコンテンツ生成に最適化されています。

テキスト生成ビデオ英語

テンセントがオープンソース化した大規模動画生成モデルで、テキストから動画を生成可能、主要なクローズドソースモデルに匹敵する性能を実現。

テキスト生成ビデオ

Mistral 7B Instruct V0.2 Fp8

FriendliAIによってFP8精度に量子化されたMistral-7B-Instruct-v0.2モデルで、高精度を維持しながら推論効率を大幅に向上させています。

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase