W

Wav2vec2 Xls R 300m German De

AndrewMcDowellによって開発
このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、MOZILLA - FOUNDATION/COMMON_VOICE_7_0 - DEデータセットで微調整されたドイツ語自動音声認識モデルです。
ダウンロード数 72
リリース時間 : 3/2/2022

モデル概要

これは、ドイツ語に最適化された自動音声認識(ASR)モデルで、XLS - R - 300Mアーキテクチャに基づき、Common Voice 7.0ドイツ語データセットで微調整されています。

モデル特徴

ドイツ語最適化
ドイツ語音声認識に特化して微調整最適化されています
XLS - Rアーキテクチャに基づく
facebookのwav2vec2 - xls - r - 300m事前学習モデルをベースに採用しています
多データセット評価
Common Voice 7やロバスト音声コンテストなどの複数のデータセットで評価されています

モデル能力

ドイツ語音声をテキストに変換
連続音声認識
音声内容の文字起こし

使用事例

音声文字起こし
ドイツ語音声文字起こし
ドイツ語音声内容をテキストに変換します
Common Voice 7テストセットでのWERは20.16%です
音声アシスタント
ドイツ語音声指令認識
ドイツ語音声アシスタントまたは音声制御システムの音声認識コンポーネントに使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase