BERT - VITS2 2.2オープンソースの日本語TTSモデル - 6種の女性の音質で無料でテキストを音声に変換

ホーム

Bert Vits2 2.2 Models Jp 6 Speaker Tts

Mofa-Xingcheによって開発

日本語テキスト読み上げをサポートするBERT-VITS2 2.2バージョンモモデル、6種類の異なるスタイルの女性声を含む

音声合成

Transformers

複数言語対応オープンソースライセンス:MIT #日本語女性ボイス #商用利用無許可 #多様なスタイルの音声合成

ダウンロード数 16

リリース時間 : 1/4/2024

モデル概要

BERT-VITS2 2.2アーキテクチャに基づく日本語テキスト読み上げモデル、自然で流暢な日本語音声を生成可能、6種類の異なる音色の女性声を選択可能

モデル特徴

多音色選択

6種類の異なるスタイルの女性声を提供、多様なニーズに対応

高品質音声合成

生成される音声は自然で流暢、真人間の発音に近い

無許可利用

モデルはMITライセンスを採用、自由に利用可能

モデル能力

日本語テキスト読み上げ

多音色音声合成

自然音声生成

使用事例

コンテンツ制作

動画ナレーション

動画コンテンツに日本語ナレーションを追加

自然で流暢なナレーションを生成

オーディオブック制作

日本語テキストをオーディオブックに変換

複数の声の選択肢を提供

支援技術

音声フィードバックシステム

アプリケーションに日本語音声フィードバックを追加

ユーザー体験を向上

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Bert Vits2 2.2 Models Jp 6 Speaker Tts

モデル概要

モデル特徴

モデル能力

使用事例

🚀 文章转语音人工智能模型 (bert - vits2 - 2.2)

🚀 クイックスタート

モデルのダウンロード

モデルダウンロードページ

ローカル環境での使用方法

スピーカーID

✨ 主な機能

📄 ライセンス

💻 使用例

サンプル音声

gogogo (ID: 0)

hutuu (ID: 1)

kirakira (ID: 2)

sayaka (ID: 3)

namera (ID: 4)

tomoe (ID: 5)

💡 使用建议

⚠️ 重要提示

💰 モデルトレーニングのための寄付

🔖 最新情報