W

Wav2vec2 Xls R 300m En Atc Atcosim

由Jzuluaga開發
該模型是基於facebook/wav2vec2-xls-r-300m在ATCOSIM語料庫上微調的版本,專用於航空交通管制通信的自動語音識別任務。
下載量 104
發布時間 : 11/16/2022

模型概述

一個針對航空交通管制(ATC)通信優化的自動語音識別(ASR)模型,在領域偏移場景下表現優異。

模型特點

領域適應性強
針對航空交通管制通信的特殊場景優化,在領域偏移情況下仍保持高性能
高效微調
僅需少量標註數據即可顯著提升在ATC領域的識別準確率
噪聲魯棒性
在信噪比5-20dB的挑戰性環境下仍能保持穩定表現

模型能力

航空管制語音識別
英語語音轉文本
噪聲環境語音處理

使用案例

航空交通管制
管制指令識別
將飛行員與管制員之間的語音通信轉換為文本
相比傳統方法降低20-40%詞錯誤率
通信記錄分析
自動轉錄ATC通信用於後續分析和存檔
測試集詞錯誤率7.36%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase