X

Xm Transformer S2ut En Hk

facebookによって開発
fairseqが開発した英語-閩南語(台湾語)音声から音声への翻訳モデル。シングルパスデコーダーアーキテクチャを採用し、中間テキストを必要としない直接音声変換をサポート
ダウンロード数 31
リリース時間 : 10/7/2022

モデル概要

このモデルは英語と閩南語(台湾語)間の直接音声から音声への翻訳に使用され、Transformerアーキテクチャを採用し、音声合成技術を組み合わせたエンドツーエンド変換を実現

モデル特徴

直接音声変換
中間テキスト表現を必要とせず、エンドツーエンドの音声から音声への翻訳を実現
複数データソースでの訓練
TED分野の教師ありデータとTEDおよびオーディオブック分野の弱教師ありデータを組み合わせて訓練
高品質音声合成
unit_hifigan_HK_layer12ボコーダーを使用して自然で流暢な音声出力を生成

モデル能力

英語から閩南語への音声翻訳
閩南語から英語への音声翻訳
言語間音声変換

使用事例

言語交流
リアルタイム音声翻訳
英語と閩南語話者間のリアルタイム会話翻訳に使用
自然で流暢な言語間コミュニケーションを実現
メディアコンテンツ処理
TED講演翻訳
英語のTED講演内容を自動的に閩南語版に翻訳
コンテンツの視聴者層を拡大
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase