S

S2t Wav2vec2 Large En De

Developed by facebook
Transformerベースのエンドツーエンド音声翻訳モデルで、英語からドイツ語への音声翻訳に特化して設計されています。
Downloads 817
Release Time : 3/2/2022

Model Overview

このモデルはTransformerベースのシーケンスツーシーケンスモデルで、事前学習されたWav2Vec2エンコーダーを組み合わせて、英語の音声をドイツ語のテキストにエンドツーエンドで翻訳します。

Model Features

エンドツーエンド音声翻訳
英語の音声入力から直接ドイツ語のテキスト出力を生成し、中間の文字起こしステップは必要ありません。
Wav2Vec2事前学習ベース
大規模な自己教師付き事前学習されたWav2Vec2を音声エンコーダーとして利用し、モデルの性能を向上させます。
Transformerアーキテクチャ
Transformerデコーダーを採用し、高品質なシーケンス生成を実現します。

Model Capabilities

英語の音声認識
英語からドイツ語への音声翻訳
エンドツーエンド音声処理

Use Cases

音声翻訳サービス
リアルタイム音声翻訳
英語の音声をリアルタイムでドイツ語のテキストに翻訳します。
CoVoST - V2テストセットで26.5のBLEUスコアを達成しました。
会議記録翻訳
英語の会議録音を自動的にドイツ語の会議要約に翻訳します。
音声支援技術
多言語音声アシスタント
英語の入力とドイツ語の出力をサポートする音声アシスタント機能です。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase