W

Wav2vec2 Xls R 2b En To 15

facebookによって開発
FacebookのWav2Vec2 XLS-Rモデルで、15言語の音声翻訳タスク向けにファインチューニングされており、英語の音声を複数の書き言葉に翻訳できます。
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

これはSpeechEncoderDecoderModelをベースにした音声翻訳モデルで、英語の音声を15の異なる書き言葉に翻訳できます。強力な音声エンコーダーとテキストデコーダーを組み合わせており、多言語翻訳シナリオに適しています。

モデル特徴

多言語サポート
英語の音声を15の異なる書き言葉に翻訳することをサポート
大規模事前学習
20億パラメータのWav2Vec2-XLS-R-2Bモデルをベースにしており、強力な音声理解能力を有する
エンドツーエンド翻訳
音声からテキストへの直接翻訳が可能で、中間の書き起こしステップが不要
高品質翻訳
Covost2データセットで優れた性能を発揮し、正確な翻訳結果を提供

モデル能力

英語音声認識
多言語テキスト翻訳
エンドツーエンド音声翻訳
15のターゲット言語をサポート

使用事例

音声翻訳
リアルタイム音声翻訳
英語の音声をリアルタイムでターゲット言語の書き言葉に翻訳
Covost2データセットで優れた性能
多言語会議議事録
英語の会議内容を自動的に複数言語の議事録に翻訳
教育応用
言語学習支援
学習者が英語の音声を理解し、母国語に翻訳するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase