F

F15

cocktailpeanutによって開発
フィッシュスピーチ V1.5は、100万時間以上の多言語音声データでトレーニングされた最先端のテキスト読み上げ(TTS)モデルです。
ダウンロード数 5,162
リリース時間 : 12/4/2024

モデル概要

高度な多言語テキスト読み上げ合成システムで、13言語の音声合成をサポートしています。

モデル特徴

多言語サポート
主流のアジア言語とヨーロッパ言語を含む13言語のテキスト読み上げをサポート
大規模トレーニングデータ
100万時間以上の多言語音声データでトレーニング(英語と中国語は各30万時間以上)
学術研究サポート
正式に発表された学術論文でモデル技術をサポート

モデル能力

テキスト読み上げ
多言語音声合成
高品質音声出力

使用事例

コンテンツ制作
オーディオブック制作
テキストコンテンツを自然な音声に変換し、オーディオブック制作に利用
高品質な多言語音声出力
動画吹き替え
動画コンテンツに自動的に音声を生成
複数言語の吹き替えオプションをサポート
支援技術
視覚障害者支援
テキスト情報を音声出力に変換し、視覚障害者を支援
多言語サポートで利用範囲を拡大
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase