W

Wav2vec2 Xls R 300m En Atc Atcosim

Jzuluagaによって開発
このモデルはfacebook/wav2vec2-xls-r-300mをATCOSIMコーパスでファインチューニングしたバージョンで、航空交通管制通信の自動音声認識タスク専用に設計されています。
ダウンロード数 104
リリース時間 : 11/16/2022

モデル概要

航空交通管制(ATC)通信に最適化された自動音声認識(ASR)モデルで、ドメインシフトシナリオでも優れた性能を発揮します。

モデル特徴

ドメイン適応性
航空交通管制通信の特殊なシナリオに最適化されており、ドメインシフト状況でも高性能を維持
効率的なファインチューニング
少量の注釈データのみでATC領域の認識精度を大幅に向上
ノイズ耐性
SN比5-20dBの困難な環境でも安定した性能を発揮

モデル能力

航空管制音声認識
英語音声テキスト変換
ノイズ環境下音声処理

使用事例

航空交通管制
管制指令認識
パイロットと管制官間の音声通信をテキストに変換
従来手法に比べ20-40%の単語誤り率低減
通信記録分析
ATC通信を自動転記して分析・アーカイブに活用
テストセット単語誤り率7.36%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase