P

Phoneme Test 5 Sv

patrickvonplatenによって開発
このモデルは、facebook/wav2vec2 - xls - r - 300mをMULTILINGUAL_LIBRISPEECH - ドイツ語10時間データセットで微調整したバージョンで、ドイツ語音声認識タスクに使用されます。
ダウンロード数 17
リリース時間 : 3/2/2022

モデル概要

これはドイツ語用に最適化された自動音声認識(ASR)モデルで、wav2vec2 - xls - r - 300mアーキテクチャを基に微調整され、ドイツ語音声認識タスクで優れた性能を発揮します。

モデル特徴

ドイツ語最適化
ドイツ語音声認識タスクに特化して微調整され、ドイツ語データセットで優れた性能を発揮します。
効率的な学習
3億パラメータのベースモデルを基に、限られたデータ(10時間)で効率的に微調整されます。
低単語誤り率
評価セットで0.1520の単語誤り率(WER)を達成し、優れた性能を示します。

モデル能力

ドイツ語音声認識
音声をテキストに変換
多言語音声処理

使用事例

音声文字起こし
ドイツ語会議記録
ドイツ語会議の録音を自動的にテキストに起こします。
高い精度の文字起こし結果で、単語誤り率はわずか15.2%です。
ドイツ語音声アシスタント
ドイツ語音声アシスタントの音声認識モジュールに使用されます。
教育
ドイツ語学習アプリ
学習者がドイツ語の発音と聴解を練習するのを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase