Argos 4b 0.2 Es
MIT
Orpheus-3Bをベースに微調整されたテキスト音声変換モデルで、テキストを自然で流暢な音声に変換できます。
音声合成
Safetensors スペイン語
A
danyw24
327
1
Spark TTS 0.5B Bf16
Spark-TTS-0.5B-fp16 はMLXフォーマットのテキスト読み上げモデルで、英語と中国語をサポートしています。
音声合成 複数言語対応
S
mlx-community
121
0
Oute TTS 500M
Apache-2.0
OuteTTSはトルコ語に特化したテキスト音声変換(TTS)モデルで、5億パラメータ規模を持ち、トルコ語テキストを自然な音声に変換できます。
音声合成 その他
O
Karayakar
27
0
Styletts2 Lite
MIT
StyleTTS 2の軽量バージョンで、テキスト読み上げタスクに特化し、複雑さを低減するため複数のコンポーネントを削除しました。
音声合成 英語
S
dangtr0408
22
0
Orpheus 3b Kaya Q4 K M.gguf
Apache-2.0
Canopy Labsの事前学習モデルをファインチューニングしたテキスト読み上げモデル、量子化後は効率的な推論をサポート
音声合成 複数言語対応
O
lex-au
98
0
Canary Tts 0.5b
sarashina2.2‑0.5b‑instruct‑v0.1に基づいて訓練された日本語TTSモデルで、プロンプトによる音質制御をサポート
音声合成
PyTorch 複数言語対応
C
2121-8
244
6
Kokoro GGUF
MIT
Kokoroはテキスト読み上げ(TTS)モデルで、2種類の音素化をサポートするGGUFエンコードバージョンを提供します。
音声合成
K
mmwillet2
749
1
3b De Ft Research Release 4bit
Apache-2.0
これはMLXフォーマット変換に基づくドイツ語テキスト音声変換モデルで、ドイツ語言語処理タスクをサポートします。
音声合成
Transformers ドイツ語

3
mlx-community
19
0
Orpheus Bangla Tts Gguf 8bit
Apache-2.0
このモデルはベンガル語をサポートするためにOrpheus 3B TTS(テキスト読み上げ)モデルを概念実証用にファインチューニングしたバージョンです。
音声合成 その他
O
asif00
44
0
Orpheus Bangla Tts Gguf
Apache-2.0
Orpheus 3B TTSモデルのベンガル語向けファインチューニング版。955の音声サンプルでトレーニングされており、実験的なベンガル語音声合成に適しています
音声合成 その他
O
asif00
55
0
Cisimi V0.1
CiSiMiはリソース制約環境向けに設計された初期のテキスト音声変換モデルプロトタイプで、CPU上で効率的に動作し、高度な音声合成を実現します。
音声合成 英語
C
KandirResearch
202
7
Kokoro 82M
Apache-2.0
Kokoroは8200万パラメータのオープンソースTTSモデルで、音質はより大規模なモデルに匹敵しつつ、顕著な速度優位性とコスト効率を備えています。
音声合成 英語
K
prince-canuma
376
2
Kokoro V1 0
Apache-2.0
Kokoroは8200万パラメータのオープンソーステキスト音声合成モデルで、軽量アーキテクチャながら大規模モデルに匹敵する音質を実現し、生成速度を向上させ計算コストを削減します。
音声合成 英語
K
kiriyamaX
18
1
Kokoro 82M Light
Apache-2.0
StyleTTS2-LJSpeechをベースにしたクローン版で、英語テキスト読み上げタスク向けに最適化され、一部の依存関係を削除して展開を簡素化しました。
音声合成 英語
K
ctranslate2-4you
21
8
Indri 0.1 350m Tts
IndriはTransformerアーキテクチャに基づく新規・超小型・軽量なTTSモデルで、英語とヒンディー語のテキスト音声変換タスクをサポートします。
音声合成
Transformers 複数言語対応

I
11mlabs
1,088
0
Japanese Parler Tts Large Bate
その他
parler-tts-large-v1をベースに再学習した日本語テキスト音声変換モデルで、高品質な日本語音声を生成可能
音声合成
Transformers 日本語

J
2121-8
114
17
Parler Tts Mini V0.1
Apache-2.0
Parler-TTS Miniは軽量なテキスト読み上げモデルで、10.5K時間の音声データでトレーニングされ、テキストプロンプトによる音声特徴の制御をサポートします。
音声合成
Transformers 英語

P
parler-tts
5,430
352
Speech T5 Ur
MIT
microsoft/speecht5_ttsをfleursデータセットでファインチューニングしたウルドゥー語音声合成モデル
音声合成
Transformers その他

S
Pak-Speech-Processing
38
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98