Aurora 1.6b
A
Aurora 1.6b
Lorenzobによって開発
Dia-1.6Bをファインチューニングした多言語感情・歌唱音声合成モデル、音色クローンと感情制御をサポート
ダウンロード数 103
リリース時間 : 5/6/2025
モデル概要
Aurora-1.6Bは多言語テキスト読み上げモデルで、感情調整、歌唱合成、ゼロショット音色クローン機能を備え、複数のヨーロッパ言語をサポートしています。
モデル特徴
多言語サポート
イタリア語、英語、ポーランド語、ドイツ語、フランス語など複数言語の音声を流暢に合成
感情制御
話者ラベルや感情タグを通じて音声表現を精密に調整
歌唱機能
歌唱プロンプトやスタイルリファレンスを入力することで、メロディックなボーカル歌唱を生成
ゼロショット音色クローン
短い音声サンプルだけで任意の話者の音色特徴をクローン可能
擬音語合成
笑い声、咳、ため息などの非言語音響効果を埋め込んで合成可能
モデル能力
多言語音声合成
感情音声生成
歌唱音声合成
音色クローン
非言語音響合成
使用事例
エンターテインメント
歌曲生成
テキストプロンプトに基づいて歌唱フラグメントを生成
『ハッピーバースデー』などの簡単な歌曲を生成可能
オーディオブック制作
多言語書籍に感情豊かな朗読音声を生成
異なるキャラクターの声と感情表現を調整可能
支援ツール
音声アシスタント
対話システムにより自然な音声出力を提供
感情表現と個性的な音色をサポート
アクセシビリティ
視覚障害者向けに多言語音声サポートを提供
話速と感情表現を調整可能
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98