モデル選定

英語TTS

# 英語TTS

これはsesame/csm-1bからMLXフォーマットに変換されたテキスト読み上げモデルで、英語をサポートしています。

音声合成複数言語対応

Dia-1.6B-3bit は mlx-community/Dia-1.6B を基に変換された3ビット量子化モデルで、主にテキストから音声への変換タスクに使用されます。

音声合成英語

Dia-1.6B-4bit はMLXフォーマットに基づく4ビット量子化テキスト音声変換モデルで、nari-labs/Dia-1.6Bから変換されました。

音声合成英語

Orpheus 3b Kaya Q2 K.gguf

Canopy Labsの事前学習モデルをファインチューニングしたテキスト音声変換モデルで、英語をサポートし、GGUF Q2_K量子化フォーマットにより効率的な推論を実現

音声合成複数言語対応

Orpheus 3b Kaya FP16.gguf

Canopy Labsの事前学習モデルをファインチューニングしたテキスト読み上げ(TTS)モデルで、GGUF FP16形式に量子化され効率的な推論を実現

音声合成複数言語対応

Orpheus 3b Kaya Q8 0.gguf

Canopy Labsの事前学習モデルをファインチューニングした8ビット量子化テキスト音声変換モデル、英語24kHz音声生成をサポート

音声合成複数言語対応

Dia-1.6B-6bit は Dia-1.6B を基にした 6 ビット量子化バージョンで、MLX フレームワーク向けに最適化されたテキスト読み上げモデルです。

音声合成英語

Parler Mini V1 Jenny

Jenny TTS は transformers ベースのテキスト読み上げモデルで、英語音声合成をサポートしています。

Transformers 英語

Parler Tts Mini Expresso

Parler-TTS Mini：Expressoは、Parler-TTS Mini v0.1をExpressoデータセットでファインチューニングした軽量テキスト音声変換モデルで、感情と話者制御をサポートしています。

Transformers 英語

Fairseq S²ベースのFastSpeech 2テキスト音声合成モデルで、英語単一話者女性音声の合成をサポートします。

音声合成英語

Speecht5 Tts Tandt

microsoft/speecht5_ttsをファインチューニングした音声合成モデルで、トリニダードアクセントをサポート

Transformers 英語

Metaが開発した英語テキスト音声合成モデル、VITSアーキテクチャに基づき、高品質な音声合成をサポート

Speecht5 Tts Commonvoice En

SpeechT5アーキテクチャに基づく英語テキスト音声変換モデル、CommonVoiceデータセットでファインチューニング済み

Transformers 英語

TorToiSe は、マルチボイス能力と高度に自然な韻律・イントネーションに特化したテキスト読み上げプログラムです。

Transformers 英語

ESPnetフレームワークでトレーニングされたJETSテキスト音声合成モデル、LJSpeechデータセットを使用し、英語音声合成をサポートします。

音声合成英語

Kan Bayashi Ljspeech Tacotron2

ESPnetフレームワークを基に訓練されたTacotron2テキスト音声変換モデルで、LJSpeechデータセットを使用しています。

音声合成英語

Kan Bayashi Ljspeech Fastspeech2

これはESPnetフレームワークでトレーニングされたFastSpeech2テキスト音声合成(TTS)モデルで、LJSpeechデータセットを使用してトレーニングされました。

音声合成英語

Fastspeech2 En Ljspeech

FastSpeech 2アーキテクチャに基づく英語テキスト音声合成モデルで、LJSpeechデータセットでトレーニングされ、単話者女性音声の合成をサポートします。

音声合成英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase