Csm 1b 8bit
Apache-2.0
これはsesame/csm-1bからMLXフォーマットに変換されたテキスト読み上げモデルで、英語をサポートしています。
音声合成 複数言語対応
C
mlx-community
36
0
Dia 1.6B 3bit
Apache-2.0
Dia-1.6B-3bit は mlx-community/Dia-1.6B を基に変換された3ビット量子化モデルで、主にテキストから音声への変換タスクに使用されます。
音声合成 英語
D
mlx-community
44
1
Dia 1.6B 4bit
Apache-2.0
Dia-1.6B-4bit はMLXフォーマットに基づく4ビット量子化テキスト音声変換モデルで、nari-labs/Dia-1.6Bから変換されました。
音声合成 英語
D
mlx-community
168
4
Orpheus 3b Kaya Q2 K.gguf
Apache-2.0
Canopy Labsの事前学習モデルをファインチューニングしたテキスト音声変換モデルで、英語をサポートし、GGUF Q2_K量子化フォーマットにより効率的な推論を実現
音声合成 複数言語対応
O
lex-au
39
0
Orpheus 3b Kaya FP16.gguf
Apache-2.0
Canopy Labsの事前学習モデルをファインチューニングしたテキスト読み上げ(TTS)モデルで、GGUF FP16形式に量子化され効率的な推論を実現
音声合成 複数言語対応
O
lex-au
45
0
Orpheus 3b Kaya Q8 0.gguf
Apache-2.0
Canopy Labsの事前学習モデルをファインチューニングした8ビット量子化テキスト音声変換モデル、英語24kHz音声生成をサポート
音声合成 複数言語対応
O
lex-au
38
0
Dia 1.6B 6bit
Apache-2.0
Dia-1.6B-6bit は Dia-1.6B を基にした 6 ビット量子化バージョンで、MLX フレームワーク向けに最適化されたテキスト読み上げモデルです。
音声合成 英語
D
mlx-community
76
4
Parler Mini V1 Jenny
Jenny TTS は transformers ベースのテキスト読み上げモデルで、英語音声合成をサポートしています。
音声合成
Transformers 英語

P
parler-tts
961
0
Parler Tts Mini Expresso
Apache-2.0
Parler-TTS Mini:Expressoは、Parler-TTS Mini v0.1をExpressoデータセットでファインチューニングした軽量テキスト音声変換モデルで、感情と話者制御をサポートしています。
音声合成
Transformers 英語

P
parler-tts
1,489
107
Text To Speech
Fairseq S²ベースのFastSpeech 2テキスト音声合成モデルで、英語単一話者女性音声の合成をサポートします。
音声合成 英語
T
Nithu
40
14
Speecht5 Tts Tandt
MIT
microsoft/speecht5_ttsをファインチューニングした音声合成モデルで、トリニダードアクセントをサポート
音声合成
Transformers 英語

S
andre-coy
16
0
Mms Tts Eng
Metaが開発した英語テキスト音声合成モデル、VITSアーキテクチャに基づき、高品質な音声合成をサポート
音声合成
Transformers

M
facebook
28.60k
146
Speecht5 Tts Commonvoice En
MIT
SpeechT5アーキテクチャに基づく英語テキスト音声変換モデル、CommonVoiceデータセットでファインチューニング済み
音声合成
Transformers 英語

S
Avitas8485
18
1
Tortoise Tts
Apache-2.0
TorToiSe は、マルチボイス能力と高度に自然な韻律・イントネーションに特化したテキスト読み上げプログラムです。
音声合成
Transformers 英語

T
Gatozu35
19
15
Jets
ESPnetフレームワークでトレーニングされたJETSテキスト音声合成モデル、LJSpeechデータセットを使用し、英語音声合成をサポートします。
音声合成 英語
J
imdanboy
15
3
Kan Bayashi Ljspeech Tacotron2
ESPnetフレームワークを基に訓練されたTacotron2テキスト音声変換モデルで、LJSpeechデータセットを使用しています。
音声合成 英語
K
espnet
40
3
Kan Bayashi Ljspeech Fastspeech2
これはESPnetフレームワークでトレーニングされたFastSpeech2テキスト音声合成(TTS)モデルで、LJSpeechデータセットを使用してトレーニングされました。
音声合成 英語
K
espnet
22
0
Fastspeech2 En Ljspeech
FastSpeech 2アーキテクチャに基づく英語テキスト音声合成モデルで、LJSpeechデータセットでトレーニングされ、単話者女性音声の合成をサポートします。
音声合成 英語
F
facebook
1,521
270
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98