W

Whisper Large V3 Turbo

deepdmlによって開発
Whisper large-v3-turboはOpenAI Whisper large-v3の蒸留版で、デコード層を32層から4層に削減し、速度が大幅に向上しましたが品質はわずかに低下しています。
ダウンロード数 883
リリース時間 : 10/1/2024

モデル概要

WhisperはOpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルで、500万時間以上の注釈付きデータでトレーニングされ、強力な汎化能力を備えています。

モデル特徴

効率的な蒸留版
デコード層を32層から4層に削減し、速度が大幅に向上しましたが品質はわずかに低下しています
多言語サポート
96言語の音声認識と翻訳をサポート
大規模トレーニング
500万時間以上の注釈付きデータでトレーニング
ゼロショット汎化能力
複数のデータセットとドメインで強力なゼロショット汎化能力を発揮

モデル能力

音声からテキストへ
音声翻訳
多言語認識
長音声処理
タイムスタンプ予測

使用事例

音声書き起こし
会議議事録
会議録音を自動的にテキスト記録に変換
高精度の書き起こしテキスト
ポッドキャスト書き起こし
ポッドキャストコンテンツを検索可能なテキストに変換
多言語対応の書き起こし
音声翻訳
リアルタイム翻訳
外国語音声を英語テキストにリアルタイム翻訳
流暢な翻訳結果
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase