# ノイズ耐性

Whisper Large V3 Turbo Atcosim Finetune
MIT
OpenAI Whisper Large V3 Turboをベースにファインチューニングしたモデルで、航空交通管制(ATC)通信の文字起こしに特化して最適化されています。
音声認識 Transformers 英語
W
tclin
28
1
AV HuBERT MuAViC Ru
AV-HuBERTは視聴音声認識モデルで、MuAViC多言語視聴コーパスで訓練され、音声と視覚モダリティを組み合わせて頑健な性能を実現します。
音声生成テキスト Transformers
A
nguyenvulebinh
91
1
Audiox South V1
Apache-2.0
AudioXはJivi AIが開発した多言語自動音声認識モデルで、特にインド南部の言語に最適化されており、タミル語、テルグ語、カンナダ語、マラヤーラム語をサポートしています。
音声認識 その他
A
jiviai
148
1
Ichigo Llama3.1 S Instruct V0.4
Apache-2.0
Llama-3アーキテクチャに基づくマルチモーダル言語モデルで、音声とテキストの入力を理解し、ノイズ耐性とマルチターン対話能力を備えています
テキスト生成オーディオ 英語
I
homebrewltd
486
19
Whisper Small Ita
Apache-2.0
OpenAI Whisper-smallを基にイタリア語向けに最適化した音声認識モデルで、特殊マーカーによるメタ情報捕捉能力を強化
音声認識 Transformers 複数言語対応
W
litus-ai
193
8
Wav2vec2 Xls R 300m En Atc Atcosim
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをATCOSIMコーパスでファインチューニングしたバージョンで、航空交通管制通信の自動音声認識タスク専用に設計されています。
音声認識 Transformers 英語
W
Jzuluaga
104
4
Wav2vec2 Base Toy Train Data Random Noise 0.1
Apache-2.0
facebook/wav2vec2-baseモデルをランダムノイズデータセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
scasutt
22
0
Byt5 Base
Apache-2.0
ByT5はGoogleのT5のトークナイザーフリーバージョンで、UTF-8バイトシーケンスを直接処理し、多言語テキスト処理をサポートし、ノイズデータに対して頑健性を持ちます。
大規模言語モデル 複数言語対応
B
google
24.17k
22
Byt5 Small
Apache-2.0
ByT5はGoogleのT5のトークナイザーフリーバージョンで、生のUTF-8バイトを直接処理し、多言語テキスト処理をサポートし、ノイズデータに対して優れた性能を発揮します。
大規模言語モデル 複数言語対応
B
google
1.4M
69
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase