S

Speecht5 Tts

microsoftによって開発
LibriTTSデータセットでファインチューニングされたSpeechT5音声合成(テキスト読み上げ)モデルで、高品質なテキスト読み上げ変換をサポートします。
ダウンロード数 113.83k
リリース時間 : 2/2/2023

モデル概要

SpeechT5は、様々な音声言語処理タスクに対応する統一モーダルエンコーダ-デコーダ事前学習フレームワークです。このモデルは特にテキスト読み上げタスク向けにファインチューニングされています。

モデル特徴

統一モーダルアーキテクチャ
統一エンコーダ-デコーダフレームワークを採用し、様々な音声言語タスクを処理
高品質音声合成
LibriTTSデータセットでファインチューニングされ、自然で滑らかな音声を生成
事前学習フレームワーク
事前学習モデルからの転移学習をサポートし、異なる音声タスクに適応

モデル能力

テキスト読み上げ
音声合成
英語音声生成

使用事例

支援技術
スクリーンリーダー
視覚障害ユーザー向けにテキスト内容を音声出力
自然で滑らかな音声を生成
コンテンツ制作
オーディオブック生成
電子書籍テキストを自動的に音声に変換
高品質な音声コンテンツを効率的に生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase