モデル選定

ゼロショット音声クローニング

# ゼロショット音声クローニング

MOSS-TTSDはオープンソースのバイリンガル口語対話合成モデルで、中国語と英語をサポートし、対話脚本を自然で表现力豊かな対話音声に変換することができます。

Safetensors 複数言語対応

Spark-TTSは、大規模言語モデル（LLM）に基づく高効率のテキスト音声変換システムで、英語と中国語のバイリンガル合成とゼロショット音声クローニングをサポートしています。

音声合成複数言語対応

Spark-TTSは大規模言語モデルを基盤とした先進的なテキスト音声変換システムで、高精度で自然な音声合成を実現します。

音声合成複数言語対応

Llamaアーキテクチャに基づく最先端の音声大規模モデルで、高品質で共感性のあるテキストから音声への生成に特化

Transformers 英語

Orpheus 3b 0.1 GGUF

Llamaアーキテクチャに基づく音声大規模モデルで、高品質なテキスト読み上げを設計し、感情制御とリアルタイムストリーミングをサポート

音声合成複数言語対応

Orpheus Exl2 4bit

Llamaアーキテクチャに基づく高品質なテキスト読み上げモデル、感情制御と音声クローニングをサポート

Transformers 英語

YaTharThShaRma999

Orpheus 3b 0.1 Ft

Llamaアーキテクチャに基づく最先端の音声大規模モデルで、高品質で共感力のあるテキスト読み上げ生成のために設計されています

Transformers 英語

Zonos V0.1 Transformer

Zonos-v0.1 は、20万時間以上の多言語音声データでトレーニングされた最先端のオープンソース重み付けテキスト音声合成モデルで、表現力と品質においてトップクラスのTTSサービスプロバイダーに匹敵、あるいは凌駕する性能を発揮します。

Metavoice 1B V0.1

MetaVoice-1Bは12億パラメータのテキスト音声合成（TTS）ベースモデルで、10万時間の音声データでトレーニングされ、感情的な英語音声の生成に特化し、音声クローニングと長文合成をサポートします。

音声合成英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase