S

S2t Small Mustc En Fr St

facebookによって開発
S2Tアーキテクチャに基づくエンドツーエンドの英語からフランス語への音声翻訳モデル、MuST-Cデータセットでトレーニング済み
ダウンロード数 2,326
リリース時間 : 3/2/2022

モデル概要

これはTransformerベースのシーケンス・ツー・シーケンスモデルで、英語音声からフランス語テキストへの翻訳タスク専用に設計されています。モデルは畳み込みダウンサンプラーを使用して音声入力を処理し、自己回帰方式で翻訳結果を生成します。

モデル特徴

エンドツーエンド音声翻訳
中間の書き起こしステップなしで、音声入力から直接テキスト翻訳を生成
畳み込みダウンサンプリング
エンコード前に畳み込み層を使用して音声入力の長さを3/4に削減し、処理効率を向上
多言語サポート
英語からフランス語への翻訳タスクに特化して最適化
SpecAugment拡張
トレーニング時にSpecAugmentデータ拡張技術を使用してモデルの堅牢性を向上

モデル能力

英語音声認識
英語からフランス語テキストへの翻訳
エンドツーエンド音声処理

使用事例

音声翻訳
TEDトークリアルタイム翻訳
英語のTEDトークをリアルタイムでフランス語テキストに翻訳
MuST-Cテストセットで32.9 BLEUスコアを達成
会議議事録翻訳
英語の会議録音を自動的にフランス語の会議議事録に翻訳
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase