W

Whisper Medium Cv11 German Ct2

mkenfenheuerによって開発
OpenAIのwhisper-mediumモデルをCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデル
ダウンロード数 21
リリース時間 : 1/13/2025

モデル概要

このモデルはドイツ語の自動音声認識タスク専用で、大文字小文字と句読点を予測でき、入力音声のサンプリングレートは16kHzが必要です。

モデル特徴

高精度ドイツ語認識
Common Voice 11.0ドイツ語テストセットで7.05%のWER(単語誤り率)を達成
句読点予測
大文字小文字と句読点を自動予測し、転写テキストの可読性を向上
Whisperアーキテクチャベース
OpenAIの強力なWhisper-mediumモデルをファインチューニングし、優れた音声認識能力を継承

モデル能力

ドイツ語音声認識
句読点予測
大文字小文字認識

使用事例

音声転写
ドイツ語会議議事録
ドイツ語会議録音を自動的に句読点付きの文字記録に転写
高精度な転写テキスト
ドイツ語メディア字幕生成
ドイツ語動画コンテンツに自動的に字幕を生成
正確な字幕テキスト
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase