🚀 ドイツ語自動音声認識モデル
このモデルは、自動音声認識タスクに特化しており、Mozilla Common Voice 6.1、Spoken Wikipedia Corpus、m-ailabsコーパスを用いて学習されました。
🚀 クイックスタート
このモデルは、Mozilla Common Voice 6.1、Spoken Wikipedia Corpus、m-ailabsコーパスを用いて学習されています。
- https://nats.gitlab.io/swc/
- https://commonvoice.mozilla.org/de/datasets
- https://www.caito.de/2019/01/03/the-m-ailabs-speech-dataset/
言語モデルは提供していません。
学習コードはこちらで見つけることができます。
✨ 主な機能
このモデルの単語誤り率(WER)は7.24%です。
(このモデルの更新版はこちらで見つけることができます: https://huggingface.co/jfreiwa/asr-crdnn-german-umlaute)
📦 インストール
SpeechBrainのインストール
まず、以下のコマンドでSpeechBrainをインストールしてください。
pip install speechbrain
SpeechBrainのチュートリアルを読み、より詳しく学ぶことをおすすめします。
💻 使用例
基本的な使用法
from speechbrain.pretrained import EncoderDecoderASR
asr_model = EncoderDecoderASR.from_hparams(source="jfreiwa/asr-crdnn-german", savedir="pretrained_models/asr-crdnn-german")
asr_model.transcribe_file("jfreiwa/asr-crdnn-german/example-de.wav")
高度な使用法
GPUで推論を行うには、from_hparams
メソッドを呼び出す際にrun_opts={"device":"cuda"}
を追加します。
📚 ドキュメント
制限事項
このモデルを他のデータセットで使用した場合のパフォーマンスについては、一切保証していません。
SpeechBrainについて
- ウェブサイト: https://speechbrain.github.io/
- コード: https://github.com/speechbrain/speechbrain/
- HuggingFace: https://huggingface.co/speechbrain/
SpeechBrainの引用
SpeechBrainを研究やビジネスで使用する場合は、以下のように引用してください。
@misc{speechbrain,
title={{SpeechBrain}: A General-Purpose Speech Toolkit},
author={Mirco Ravanelli and Titouan Parcollet and Peter Plantinga and Aku Rouhe and Samuele Cornell and Loren Lugosch and Cem Subakan and Nauman Dawalatabad and Abdelwahab Heba and Jianyuan Zhong and Ju-Chieh Chou and Sung-Lin Yeh and Szu-Wei Fu and Chien-Feng Liao and Elena Rastorgueva and François Grondin and William Aris and Hwidong Na and Yan Gao and Renato De Mori and Yoshua Bengio},
year={2021},
eprint={2106.04624},
archivePrefix={arXiv},
primaryClass={eess.AS},
note={arXiv:2106.04624}
}
本モデルの引用
このモデルを研究で使用する場合は、以下のように引用してください。
@inproceedings{freiwald2022,
author={J. Freiwald and P. Pracht and S. Gergen and D. Kolossa},
title={Open-Source End-To-End Learning for Privacy-Preserving German {ASR}},
year=2022,
booktitle={DAGA 2022}
}
謝辞
この研究は、ドイツ連邦教育研究省(BMBF)の「Innovations for Tomorrow’s Production, Services, and Work」プログラム(02L19C200)の助成を受けて行われました。このプロジェクトは、カールスルーエのプロジェクト管理機関(PTKA)によって実施されています。本出版物の内容については、著者が責任を負います。
📄 ライセンス
このモデルはCC BY-SA 4.0ライセンスの下で提供されています。