W

Wav2vec2 Xls R 300m En To 15

facebookによって開発
FacebookのWav2Vec2 XLS - Rモデルを微調整して、多言語音声翻訳タスクに使用します。英語から15言語への翻訳をサポートします。
ダウンロード数 167
リリース時間 : 3/2/2022

モデル概要

これはSpeechEncoderDecoderModelに基づく音声翻訳モデルで、英語の口頭語を15種類の異なる書面言語に翻訳することができます。

モデル特徴

多言語サポート
英語から15言語への翻訳をサポートします
XLS - Rアーキテクチャに基づく
先進的なWav2Vec2 XLS - R 300Mモデルをエンコーダとして採用しています
エンドツーエンドの音声翻訳
音声入力からテキスト出力までの直接的な翻訳フロー

モデル能力

英語音声認識
多言語テキスト翻訳
音声からテキストへの変換

使用事例

音声翻訳
英語からドイツ語への翻訳
英語の口頭語をリアルタイムでドイツ語のテキストに翻訳します
Covost2データセットで良好な性能を示します
多言語会議記録
英語の会議録音を複数言語のテキスト記録に翻訳します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase