S

S2t Wav2vec2 Large En De

facebookによって開発
Transformerベースのエンドツーエンド音声翻訳モデルで、英語からドイツ語への音声翻訳に特化して設計されています。
ダウンロード数 817
リリース時間 : 3/2/2022

モデル概要

このモデルはTransformerベースのシーケンスツーシーケンスモデルで、事前学習されたWav2Vec2エンコーダーを組み合わせて、英語の音声をドイツ語のテキストにエンドツーエンドで翻訳します。

モデル特徴

エンドツーエンド音声翻訳
英語の音声入力から直接ドイツ語のテキスト出力を生成し、中間の文字起こしステップは必要ありません。
Wav2Vec2事前学習ベース
大規模な自己教師付き事前学習されたWav2Vec2を音声エンコーダーとして利用し、モデルの性能を向上させます。
Transformerアーキテクチャ
Transformerデコーダーを採用し、高品質なシーケンス生成を実現します。

モデル能力

英語の音声認識
英語からドイツ語への音声翻訳
エンドツーエンド音声処理

使用事例

音声翻訳サービス
リアルタイム音声翻訳
英語の音声をリアルタイムでドイツ語のテキストに翻訳します。
CoVoST - V2テストセットで26.5のBLEUスコアを達成しました。
会議記録翻訳
英語の会議録音を自動的にドイツ語の会議要約に翻訳します。
音声支援技術
多言語音声アシスタント
英語の入力とドイツ語の出力をサポートする音声アシスタント機能です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase