# FP16効率的推論

Spark TTS 0.5B Bf16
Spark-TTS-0.5B-fp16 はMLXフォーマットのテキスト読み上げモデルで、英語と中国語をサポートしています。
音声合成 複数言語対応
S
mlx-community
121
0
Wan2.1 T2V 14B Gguf
Apache-2.0
GGUF形式に変換されたテキスト生成動画モデルで、ComfyUI-GGUFカスタムノードを使用可能
テキスト生成ビデオ
W
city96
42.38k
130
Controlnet Illustrious Softedge Hed Sdxl Fp16
Stable Diffusion XLをベースにしたControlNetモデルで、ソフトエッジHED(Holistically-Nested Edge Detection)による画像生成制御に特化しています。
画像生成
C
r3gm
60
0
Controlnet Kohaku Canny Sdxl Fp16
Stable Diffusion XLベースのControlNetモデルで、Cannyエッジ検出による精密な画像生成制御に特化
画像生成
C
r3gm
19
0
Faster Whisper Small
MIT
OpenAI Whisper小型モデルのCTranslate2フォーマット変換版、効率的な音声認識用
音声認識 複数言語対応
F
Systran
376.48k
13
Faster Whisper Base
MIT
これはOpenAI WhisperベースモデルのCTranslate2変換バージョンで、効率的な音声認識タスクに使用されます。
音声認識 複数言語対応
F
Systran
1.1M
13
Faster Whisper Medium
MIT
これはOpenAI Whisperの中規模モデルのCTranslate2変換バージョンで、効率的な音声認識タスクに使用されます。
音声認識 複数言語対応
F
Systran
155.87k
29
Faster Whisper Large Zh Cv11
これはjonatasgrosman/whisper-large-zh-cv11モデルのCTranslate2変換バージョンで、効率的な音声認識タスク向けに最適化されており、特に中国語音声認識能力が強化されています。
音声認識 中国語
F
arc-r
22
9
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase