# FP8効率的推論

Qwen3 235B A22B FP8
Apache-2.0
Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、密モデルと混合エキスパート(MoE)モデルの完全なスイートを提供します。大規模なトレーニングに基づき、Qwen3は推論、指示の遵守、エージェント能力、多言語サポートにおいて画期的な進歩を実現しました。
大規模言語モデル Transformers
Q
Qwen
47.30k
68
Qwen3 14B FP8
Apache-2.0
Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、全シリーズの密モデルと混合専門家(MoE)モデルを提供し、推論、命令追従、エージェント能力、多言語サポートにおいて画期的な進展を遂げています。
大規模言語モデル Transformers
Q
Qwen
16.28k
19
Qwen3 4B FP8
Apache-2.0
Qwen3-4B-FP8は通義千問シリーズ最新の大規模言語モデルで、40億パラメータのFP8量子化バージョンを提供し、思考モードと非思考モードの切り替えをサポートし、推論、指示追従、エージェント能力において優れた性能を発揮します。
大規模言語モデル Transformers
Q
Qwen
23.95k
22
Hyvid
MIT
Tencent Hunyuanビデオモデルを基にしたアニメスタイルアダプターで、高品質なテキストからビデオ生成能力を提供し、特にアニメスタイルのコンテンツ生成に最適化されています。
テキスト生成ビデオ 英語
H
calcuis
1,392
20
Hunyuanvideo
その他
テンセントがオープンソース化した大規模動画生成モデルで、テキストから動画を生成可能、主要なクローズドソースモデルに匹敵する性能を実現。
テキスト生成ビデオ
H
tencent
2,285
1,837
Mistral 7B Instruct V0.2 Fp8
Apache-2.0
FriendliAIによってFP8精度に量子化されたMistral-7B-Instruct-v0.2モデルで、高精度を維持しながら推論効率を大幅に向上させています。
大規模言語モデル Transformers
M
FriendliAI
37
12
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase