Kokorotts
Apache-2.0
Kokoroは8200万のパラメータを持つオープンソースのテキスト音声変換モデルで、軽量なアーキテクチャで大型モデルに匹敵する音質を提供し、同時に速度とコスト効率を大幅に向上させます。
音声合成 英語
K
Daemontatox
78
0
Kokoro 82M
Apache-2.0
Kokoroは8200万パラメータのオープンソースTTSモデルで、音質はより大規模なモデルに匹敵しつつ、顕著な速度優位性とコスト効率を備えています。
音声合成 英語
K
prince-canuma
376
2
W2v Bert Uk V2.1
Apache-2.0
facebook/w2v-bert-2.0を基にしたウクライナ語音声認識モデル、Yehor/openstt-ukデータセットでファインチューニング
音声認識
Transformers その他

W
Yehor
492
1
Parler Tts Mini V0.1
Apache-2.0
Parler-TTS Miniは軽量なテキスト読み上げモデルで、10.5K時間の音声データでトレーニングされ、テキストプロンプトによる音声特徴の制御をサポートします。
音声合成
Transformers 英語

P
parler-tts
5,430
352
Silero Model V3 Ru
Silero 音声モデルはロシア語に特化したテキスト読み上げ(TTS)モデルで、snakers4によって開発されオープンソース化されました。
音声合成
Transformers その他

S
imperialwool
22
4
W2v Xls R Uk
Apache-2.0
facebook/wav2vec2-xls-r-300mを基にしたウクライナ語自動音声認識モデル、Common Voice 10.0データセットでトレーニング
音声認識
Transformers その他

W
Yehor
231.46k
8
Kan Bayashi Ljspeech Vits
ESPnetフレームワークに基づいて訓練されたVITSテキスト音声変換モデルで、LJSpeechデータセットを使用して訓練され、英語の音声合成をサポートします。
音声合成 英語
K
espnet
2,780
224
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98