Orpheus 3b Kaya Q8 0.gguf
Apache-2.0
Canopy Labsの事前学習モデルをファインチューニングした8ビット量子化テキスト音声変換モデル、英語24kHz音声生成をサポート
音声合成 複数言語対応
O
lex-au
38
0
Orpheus TTS Turkish PT 2000 GGUF
MIT
Orpheus-TTS-Turkish-PT-2000 はトルコ語ベースのテキスト読み上げ(TTS)モデルで、高品質な音声合成をサポートします。
音声合成 その他
O
Karayakar
45
1
Indicf5
IndicF5は人間レベルの多言語テキスト読み上げ(TTS)モデルで、11のインド言語をサポートし、1417時間の高品質音声データでトレーニングされています。
音声合成 その他
I
shethjenil
46
0
Parler Tts Mini Multilingual
Apache-2.0
Parler-TTS Mini 多言語版はParler-TTS Miniの多言語拡張バージョンで、8つのヨーロッパ言語のテキスト音声変換をサポートしています
音声合成
Transformers 複数言語対応

P
parler-tts
603
22
Speecht5 Finetuned Emirhan Tr
MIT
Microsoft SpeechT5をファインチューニングしたトルコ語テキスト音声変換モデルで、高品質なトルコ語音声を生成できます。
音声合成
TensorBoard その他

S
emirhanbilgic
22
1
Parler Tts Mini V0.1
Apache-2.0
Parler-TTS Miniは軽量なテキスト読み上げモデルで、10.5K時間の音声データでトレーニングされ、テキストプロンプトによる音声特徴の制御をサポートします。
音声合成
Transformers 英語

P
parler-tts
5,430
352
Tts Vits Ru Hf
これはVITSアーキテクチャに基づくロシア語テキスト音声変換モデルで、ロシア語テキストを自然な音声に変換できます。
音声合成
Transformers その他

T
joefox
382
14
Text To Speech
Fairseq S²ベースのFastSpeech 2テキスト音声合成モデルで、英語単一話者女性音声の合成をサポートします。
音声合成 英語
T
Nithu
40
14
Fastspeech2 Conformer With Hifigan
Apache-2.0
FastSpeech2ConformerとHiFi-GANを統合したテキスト音声合成モデルで、効率的で高品質な音声合成を提供
音声合成
Transformers 英語

F
espnet
635
0
Nvidia Tts En Hifitts Hifigan Ft Fastpitch
HiFiGANはGANベースのボコーダーモデルで、メルスペクトログラムから高品質な音声を生成でき、マルチスピーカーの英語音声合成をサポートします。
音声合成 英語
N
Mastering-Python-HF
16
0
Amadeus
これはESPnet2フレームワークでトレーニングされた日本語テキスト読み上げ(TTS)モデルで、VITSアーキテクチャを使用し、mioによってamadeusデータセットでトレーニングされました。
音声合成 日本語
A
mio
37
85
Tts Hifigan
HiFiGANは生成敵対ネットワーク(GAN)モデルで、メルスペクトログラムから高品質な音声を生成でき、テキスト読み上げシステムに適しています。
音声合成 英語
T
nvidia
5,022
36
Kss Tts Train Jets Raw Phn Null G2pk Train.total Count.ave
これはESPnet2フレームワークで訓練された韓国語テキスト音声変換(TTS)モデルで、KSSデータセットを使用し、JETSアーキテクチャを採用しています。
音声合成 韓国語
K
imdanboy
60
0
Gunnarthor Talromur A Fastspeech2
ESPnetフレームワークとtalromurデータセットでトレーニングされたFastSpeech2テキスト音声合成モデルで、アイスランド語の音声合成をサポートします。
音声合成 英語
G
espnet
50
0
Hifigan Lj V1
LJ SpeechデータセットでトレーニングされたHiFi-GANボコーダーモデル、高品質な音声合成用
音声合成
Transformers 英語

H
jaketae
32
0
Kan Bayashi Ljspeech Vits
ESPnetフレームワークに基づいて訓練されたVITSテキスト音声変換モデルで、LJSpeechデータセットを使用して訓練され、英語の音声合成をサポートします。
音声合成 英語
K
espnet
2,780
224
Kan Bayashi Ljspeech Fastspeech2
これはESPnetフレームワークでトレーニングされたFastSpeech2テキスト音声合成(TTS)モデルで、LJSpeechデータセットを使用してトレーニングされました。
音声合成 英語
K
espnet
22
0
Kan Bayashi Libritts Xvector Vits
ESPnetフレームワークでトレーニングされたテキスト読み上げモデルで、LibriTTSデータセットを使用して英語音声合成をサポートします。
音声合成 英語
K
espnet
61
0
Kan Bayashi Jvs Tts Finetune Jvs001 Jsut Vits Raw Phn Jaconv Pyopenjta Truncated 178804
これはESPnetフレームワークを基に訓練された日本語のテキストを音声に変換する(TTS)モデルで、jvsデータセットを使用して微調整され、高品質の日本語音声合成をサポートします。
音声合成 日本語
K
espnet
19
1
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98