X

Xm Transformer S2ut Hk En

facebookによって開発
fairseqベースのシングルパスデコーダー音声から音声への翻訳モデル(S2UT)、閩南語-英語相互翻訳をサポート
ダウンロード数 17
リリース時間 : 10/7/2022

モデル概要

このモデルは音声から音声への翻訳システムで、閩南語を直接英語音声に翻訳、または逆方向の翻訳が可能です。Transformerアーキテクチャを採用し、HiFi-GANボコーダーによる音声合成を組み合わせています。

モデル特徴

エンドツーエンド音声翻訳
中間テキスト表現を必要とせず、ソース言語音声から直接ターゲット言語音声に変換
多分野訓練データ
TED講演、テレビドラマ、TATコーパスなどの分野の教師付きおよび弱教師付きデータを使用して訓練
高品質音声合成
unit_hifigan_mhubertボコーダーモデルを使用して自然で流暢なターゲット音声を生成

モデル能力

閩南語から英語への音声翻訳
英語から閩南語への音声翻訳
直接音声から音声への変換

使用事例

異言語間コミュニケーション
閩南語-英語リアルタイム翻訳
閩南語と英語話者間のリアルタイム音声コミュニケーションに使用
メディアコンテンツのローカライズ
テレビドラマの吹き替え
閩南語のテレビドラマを自動翻訳し英語版に吹き替え
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase