W

Whisper Large V3 Turbo German Ct2

jimmymeisterによって開発
Whisper Large v3をベースとしたドイツ語音声認識モデル、ドイツ語音声処理と認識に最適化
ダウンロード数 38
リリース時間 : 11/13/2024

モデル概要

このモデルはWhisper Large v3をベースとしており、ドイツ語音声認識に特化して微調整されています。ドイツ語音声の文字起こし、音声コマンドと制御、動画の自動字幕生成などのシナリオに適しています。

モデル特徴

高性能ドイツ語音声認識
ドイツ語ASR混合データセットで2.628%の単語誤り率(WER)を達成し、優れた性能を発揮。
最適化されたトレーニングプロセス
Ademamixオプティマイザーと厳選されたトレーニングデータを使用し、モデルの認識性能を向上。
CTranslate2互換
faster-whisperなどCTranslate互換フレームワークに適しており、展開と使用が容易。

モデル能力

ドイツ語音声文字起こし
音声コマンド認識
動画字幕生成
音声検索クエリ
ディクテーション機能

使用事例

音声文字起こし
ドイツ語音声文字起こし
ドイツ語音声コンテンツをテキストに変換、会議議事録やインタビュー文字起こしなどのシナリオに適しています。
単語誤り率が2.628%と低い
動画字幕生成
ドイツ語動画自動字幕
ドイツ語動画コンテンツに正確な字幕を生成し、アクセシビリティを向上。
音声制御
ドイツ語音声コマンド認識
ドイツ語音声コマンドを認識、スマートホームや車載システムなどのシナリオに適しています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase