W

Wav2vec2 Xls R 300m 21 To En

facebookによって開発
FacebookのWav2Vec2 XLS-Rは21言語から英語への音声翻訳用にファインチューニングされています
ダウンロード数 464
リリース時間 : 3/2/2022

モデル概要

これはSpeechEncoderDecoderModelベースの音声翻訳モデルで、21の話し言葉を英語に翻訳できます。エンコーダーはfacebook/wav2vec2-xls-r-300m、デコーダーはfacebook/mbart-large-50をベースにしており、Covost2データセットでファインチューニングされています。

モデル特徴

多言語サポート
21言語から英語への音声翻訳をサポート
XLS-Rアーキテクチャベース
先進的なWav2Vec2 XLS-R 300Mモデルをエンコーダーとして採用
エンドツーエンド翻訳
中間の書き起こしステップなしで音声入力から直接英語テキストを生成
高品質翻訳
Covost2データセットで優れた性能、特に一般的な言語で良好な結果

モデル能力

音声翻訳
多言語処理
自動音声認識
エンドツーエンド音声からテキスト

使用事例

音声翻訳サービス
リアルタイム音声翻訳
会議や会話中の外国語を英語にリアルタイム翻訳
高品質な翻訳出力、複数言語サポート
マルチメディアコンテンツ翻訳
ポッドキャスト、動画などのマルチメディアコンテンツ内の音声を翻訳
音声内容を正確に捕捉し英語テキストに変換
支援技術
言語学習支援
言語学習者が外国語コンテンツを理解するのを支援
正確な翻訳リファレンスを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase