S

Speecht5 Tts Hr

nikolabによって開発
クロアチア語に最適化されたSpeechT5テキスト音声変換ファインチューニングモデル、マイクロソフトSpeechT5アーキテクチャとVoxPopuliデータセットでトレーニング
ダウンロード数 124
リリース時間 : 9/30/2024

モデル概要

Transformerアーキテクチャに基づく音声合成モデル、クロアチア語のテキストから音声への変換をサポート、音声アシスタント、オーディオブックなどのシナリオに適用可能

モデル特徴

マルチモーダル統合アーキテクチャ
単一アーキテクチャでテキストと音声処理能力を統合、クロスモーダル変換をサポート
クロアチア語最適化
43時間のクロアチア語VoxPopuliデータセットでファインチューニング、83名の話者データを含む
多言語拡張性
旧ユーゴスラビア地域の言語(モンテネグロ語/セルビア語/ボスニア語)の拡張をサポートするアーキテクチャ設計
話者バランス
トレーニングデータは話者統計分析を経ており、男女の話者比率がバランス良く保たれている

モデル能力

クロアチア語テキスト音声変換
音声合成
クロスモーダル表現学習

使用事例

音声アシスタント
クロアチア語音声インタラクション
スマートデバイス向けに自然な音声出力を提供
20語以内の流暢な音声生成をサポート
アクセシビリティ技術
テキスト音声変換サービス
視覚障害ユーザーのためにテキストコンテンツを音声に変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase