W

Wav2vec2 Large 960h Lv60 Self En Atc Uwb Atcc

Jzuluagaによって開発
facebook/wav2vec2-large-960h-lv60-selfモデルをUWB-ATCC航空交通管制通信データセットでファインチューニングした音声認識モデル
ダウンロード数 115
リリース時間 : 11/30/2022

モデル概要

このモデルは航空交通管制(ATC)通信シナリオ向けの英語音声認識に特化しており、ドメインシフト状況下でも優れた性能を発揮します

モデル特徴

ドメイン適応性が高い
航空交通管制通信シナリオに最適化されており、ドメインシフト時も高性能を維持
低リソースで効率的
少量のアノテーションデータでファインチューニングするだけで性能が大幅向上
言語モデル統合をサポート
KenLM言語モデルと組み合わせることで認識精度をさらに向上可能

モデル能力

英語航空交通管制音声認識
ノイズ環境下での音声認識
ドメイン固有用語認識

使用事例

航空交通管制
ATC通信文字起こし
航空管制官とパイロット間の音声通信をテキストに変換
単語誤り率(WER)17.2(LMなし)/13.72(LMあり)
航空音声データ分析
航空安全研究や通信効率分析を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase