W

Whisper Small Cv11 German

bofenghuangによって開発
openai/whisper-smallをCommon Voice 11.0ドイツ語データセットで微調整した音声認識モデルで、ドイツ語音声をテキストに変換し、大文字小文字と句読点を予測します。
ダウンロード数 67
リリース時間 : 12/18/2022

モデル概要

これはドイツ語向けに最適化された自動音声認識(ASR)モデルで、Whisper-smallアーキテクチャを基に微調整されており、ドイツ語音声の文字起こしタスクに適しています。

モデル特徴

ドイツ語最適化
ドイツ語音声データに特化して微調整されており、ドイツ語認識タスクで元のWhisper-smallモデルよりも優れた性能を発揮します
句読点予測
大文字小文字と句読点を自動予測し、より規範的なテキスト出力を生成します
効率的な推論
より大規模なWhisperモデルと比較して、良好な性能を維持しながらより高速な推論速度を実現します

モデル能力

ドイツ語音声認識
音声からテキストへの変換
句読点予測
大文字小文字変換

使用事例

音声文字起こし
会議議事録
ドイツ語会議録音を自動的に文字記録に変換
単語誤り率11.35%
メディア字幕生成
ドイツ語動画コンテンツの自動字幕生成
音声アシスタント
ドイツ語音声入力
ドイツ語音声アシスタントに音声認識機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase