F

Faster Distil Whisper Large V3.5

deepdmlによって開発
Distil-Whisper large-v3.5を変換したCTranslate2フォーマットモデルで、効率的な音声認識に使用
ダウンロード数 58.15k
リリース時間 : 3/26/2025

モデル概要

これは自動音声認識(ASR)モデルで、Distil-Whisper large-v3.5から変換され、CTranslate2フレームワーク向けに最適化されており、効率的な音声からテキストへの変換機能を提供します。

モデル特徴

効率的な推論
CTranslate2フレームワークによる最適化で、元のPyTorch実装よりも高速な推論を提供
FP16精度
モデル重みはFP16フォーマットで保存され、精度と性能のバランスを実現
faster-whisper互換
faster-whisperなどCTranslate2ベースのプロジェクトで直接使用可能

モデル能力

英語音声認識
長時間音声の文字起こし
リアルタイム音声テキスト変換

使用事例

音声文字起こし
会議議事録
会議録音を自動的に文字記録に変換
ポッドキャスト文字起こし
ポッドキャストの音声コンテンツを検索可能なテキストに変換
支援ツール
リアルタイム字幕生成
動画やライブコンテンツのためのリアルタイム英語字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase