S

S2t Medium Mustc Multilingual St

facebookによって開発
Transformerベースのエンドツーエンド多言語音声翻訳モデルで、英語から複数言語への音声翻訳をサポート
ダウンロード数 7,322
リリース時間 : 3/2/2022

モデル概要

このモデルはTransformerアーキテクチャを採用し、エンドツーエンドの自動音声認識と音声翻訳のために設計されており、畳み込みダウンサンプラーで音声入力を処理し、自己回帰方式で翻訳結果を生成します。

モデル特徴

多言語サポート
英語からフランス語、ドイツ語、スペイン語など8言語への音声翻訳をサポート。
エンドツーエンドアーキテクチャ
エンドツーエンド設計を採用し、音声特徴から直接対象言語テキストを生成することで、従来のパイプラインシステムを簡素化。
効率的な音声処理
畳み込みダウンサンプラーにより音声入力長を3/4に縮小し、処理効率を向上。

モデル能力

英語音声認識
多言語音声翻訳
自動音声テキスト変換

使用事例

音声翻訳サービス
リアルタイム音声翻訳
英語のスピーチや会話をリアルタイムで対象言語テキストに翻訳
MuST-Cテストセットで24.5-34.9 BLEUスコアを達成
マルチメディア字幕生成
英語動画コンテンツの多言語字幕を生成
言語学習支援
言語学習ツール
言語学習者が英語音声コンテンツを理解するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase