W

Whisper Large V2 Cv11 German

bofenghuangによって開発
openai/whisper-large-v2をCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデルで、ドイツ語音声をテキストに変換可能、単語誤り率5.76
ダウンロード数 179
リリース時間 : 12/18/2022

モデル概要

本モデルはwhisper-large-v2をドイツ語データセットでファインチューニングしたバージョンで、ドイツ語自動音声認識タスク専用に設計されており、大文字小文字と句読点を予測できます。

モデル特徴

低単語誤り率
Common Voice 11.0ドイツ語テストセットで5.76のWERを達成し、同シリーズの他サイズモデルよりも優れた性能
句読点予測
大文字小文字と句読点を自動予測し、転写テキストの可読性を向上
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に最適化

モデル能力

ドイツ語音声認識
音声からテキストへの変換
句読点予測

使用事例

音声転写
ドイツ語会議議事録
ドイツ語会議録音を自動的にテキスト議事録に変換
句読点を含む高精度な転写テキスト
ドイツ語メディア字幕生成
ドイツ語動画やポッドキャストの字幕を自動生成
正確なタイミング調整された字幕
音声アシスタント
ドイツ語音声コマンド認識
ドイツ語音声アシスタントでユーザーコマンドを認識
高精度なコマンド認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase