A

Asr Crdnn German

jfreiwaによって開発
Mozilla Common Voice 6.1、ドイツ語ウィキペディア音声コーパスおよびm-ailabsコーパスで訓練されたドイツ語ASRモデル、単語誤り率7.24%
ダウンロード数 17
リリース時間 : 3/29/2022

モデル概要

これはドイツ語自動音声認識(ASR)モデルで、CRDNNアーキテクチャを採用し、ドイツ語音声をテキストに変換することをサポートします。

モデル特徴

複数データソース訓練
Mozilla Common Voice、ドイツ語ウィキペディア音声、m-ailabsの3つの高品質ドイツ語音声データセットを統合
低単語誤り率
テストセットで7.24%の単語誤り率(WER)を達成
オープンソース実装
完全な訓練コードと事前訓練済みモデルはGitHubでオープンソース化

モデル能力

ドイツ語音声テキスト変換
長音声文字起こし
リアルタイム音声認識

使用事例

音声文字起こし
会議議事録
ドイツ語会議録音を自動的に文字記録に変換
約92.76%の精度
字幕生成
ドイツ語動画コンテンツに自動的に字幕を生成
音声アシスタント
ドイツ語音声コマンド認識
ドイツ語音声制御システム用音声認識モジュール
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase