W

Wav2vec2 Xls R 300m En Atc Uwb Atcc And Atcosim

Jzuluagaによって開発
wav2vec2-xls-r-300mをファインチューニングした航空管制通信音声認識モデル、英語対応
ダウンロード数 37
リリース時間 : 11/30/2022

モデル概要

このモデルは航空管制通信データセットでファインチューニングされた音声認識モデルで、航空管制分野の音声認識タスクに特化しています。

モデル特徴

ドメイン特化
航空管制通信分野に最適化されており、汎用音声認識モデルよりも優れた性能を発揮
複数データセット学習
UWB-ATCCとATCOSIMの2つの航空管制データセットで共同訓練
言語モデル対応
KenLM言語モデルと組み合わせて認識精度をさらに向上可能

モデル能力

航空管制音声認識
英語音声テキスト変換
ノイズ環境下での音声認識

使用事例

航空交通管制
管制官指令認識
航空管制官とパイロット間の通信指令を認識
UWB-ATCCテストセットでWER24.96%
シミュレーション訓練システム
航空管制官訓練シミュレーションシステムでの音声インタラクションに使用
ATCOSIMテストセットでWER4.09%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase