W

Whisper Large V2 Cv11 German

Developed by bofenghuang
openai/whisper-large-v2をCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデルで、ドイツ語音声をテキストに変換可能、単語誤り率5.76
Downloads 179
Release Time : 12/18/2022

Model Overview

本モデルはwhisper-large-v2をドイツ語データセットでファインチューニングしたバージョンで、ドイツ語自動音声認識タスク専用に設計されており、大文字小文字と句読点を予測できます。

Model Features

低単語誤り率
Common Voice 11.0ドイツ語テストセットで5.76のWERを達成し、同シリーズの他サイズモデルよりも優れた性能
句読点予測
大文字小文字と句読点を自動予測し、転写テキストの可読性を向上
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に最適化

Model Capabilities

ドイツ語音声認識
音声からテキストへの変換
句読点予測

Use Cases

音声転写
ドイツ語会議議事録
ドイツ語会議録音を自動的にテキスト議事録に変換
句読点を含む高精度な転写テキスト
ドイツ語メディア字幕生成
ドイツ語動画やポッドキャストの字幕を自動生成
正確なタイミング調整された字幕
音声アシスタント
ドイツ語音声コマンド認識
ドイツ語音声アシスタントでユーザーコマンドを認識
高精度なコマンド認識
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase