# リアルタイム音声認識

Ultravox V0 4 ToolACE 8B
これは🤗 transformersモデルの説明カードで、音声テキストからテキストへのタスク用にHubプラットフォームにプッシュされています。
音声認識 Transformers
U
fixie-ai
1,178
1
Parakeet Tdt Ctc 110m
NVIDIA NeMoとSuno.aiが共同開発した英語音声認識モデルで、句読点と大文字小文字変換をサポートし、FastConformer-TDT-CTCアーキテクチャを採用
音声認識 英語
P
nvidia
50.47k
28
Distilhubert Finetuned Cry Detector
Apache-2.0
distilhubertアーキテクチャを微調整した泣き声検出モデルで、評価データセットで優れた性能を示し、精度は98.83%に達しました
音声分類 Transformers
D
Marcos12886
22
1
Akylai STT Small
Apache-2.0
キルギス語Whisper ASRは、キルギス語に特化した自動音声認識ソリューションで、事前学習済みWhisperモデルをファインチューニングしたものです。
音声認識 Transformers その他
A
the-cramer-project
73
1
Whisper Small Kyrgyz
Whisperアーキテクチャに基づくキルギス語自動音声認識(ASR)モデルで、キルギス共和国大統領府国家言語・言語政策全国委員会の支援により開発
音声認識 Transformers その他
W
UlutSoftLLC
841
4
Faster Whisper Small
MIT
OpenAI Whisper小型モデルのCTranslate2フォーマット変換版、効率的な音声認識用
音声認識 複数言語対応
F
Systran
376.48k
13
Faster Whisper Large V2
MIT
Whisper large-v2はOpenAIが開発した大規模自動音声認識(ASR)モデルで、複数言語の音声から文字への変換タスクをサポートします。
音声認識 複数言語対応
F
Systran
948.29k
34
Englishspeechtotext
Apache-2.0
facebook/wav2vec2-xls-r-300mをファインチューニングした英語音声認識モデル
音声認識 Transformers
E
Foxasdf
24
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase