# リアルタイム音声書き起こし

Whisper Large V3 Turbo
MIT
WhisperはOpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルで、500万時間以上のラベル付きデータでトレーニングされ、強力なゼロショット汎化能力を備えています。Turboバージョンはオリジナルのプルーニングおよび微調整バージョンで、デコード層を32層から4層に削減し、速度が大幅に向上していますが、品質はわずかに低下しています。
音声認識 Transformers 複数言語対応
W
unsloth
94
1
Whisper Large V3
Apache-2.0
WhisperはOpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルで、複数言語をサポート
音声認識 Safetensors 複数言語対応
W
unsloth
4,002
1
Erax WoW Turbo V1.1 CT2
MIT
CTranslate2で最適化されたWhisper Large-v3 Turboのベトナム語強化ローカライズ版で、多言語音声認識をサポートし、高速で高精度
音声認識 Transformers その他
E
erax-ai
1,283
7
Erax WoW Turbo V1.1
MIT
ベトナム語に最適化されたWhisper Large-v3 Turbo音声認識モデルで、多言語をサポートし、超高速応答と高精度を実現
音声認識 Transformers その他
E
erax-ai
666
11
Gigaam Rnnt
MIT
GigaAM-v2-RNNT はロシア語自動音声認識(ASR)モデルで、RNNTアーキテクチャに基づいており、音声からテキストへの変換タスクに適しています。
音声認識 Transformers その他
G
waveletdeboshir
70
1
Gigaam Ctc
MIT
GigaAM-v2-CTCはCTC損失関数でトレーニングされたロシア語自動音声認識(ASR)モデルで、Hugging Face transformersライブラリを通じて利用可能です。
音声認識 Transformers その他
G
waveletdeboshir
255
1
Erax WoW Turbo V1.0
MIT
ベトナム語に最適化されたWhisper Large-v3 Turbo音声認識モデルで、多言語リアルタイム書き起こしをサポート
音声認識 Transformers その他
E
erax-ai
655
49
Whisper Large V3 Turbo
Apache-2.0
Whisper large-v3-turboはOpenAI Whisper large-v3の蒸留版で、デコード層を32層から4層に削減し、速度が大幅に向上しましたが品質はわずかに低下しています。
音声認識 複数言語対応
W
deepdml
883
6
W2v Bert Uk V2.1
Apache-2.0
facebook/w2v-bert-2.0を基にしたウクライナ語音声認識モデル、Yehor/openstt-ukデータセットでファインチューニング
音声認識 Transformers その他
W
Yehor
492
1
Faster Whisper Base
MIT
これはOpenAI WhisperベースモデルのCTranslate2変換バージョンで、効率的な音声認識タスクに使用されます。
音声認識 複数言語対応
F
Systran
1.1M
13
Faster Whisper Medium
MIT
これはOpenAI Whisperの中規模モデルのCTranslate2変換バージョンで、効率的な音声認識タスクに使用されます。
音声認識 複数言語対応
F
Systran
155.87k
29
Whisper Large V3 Atco2 Asr
Apache-2.0
OpenAI Whisper-large-v3をファインチューニングした音声認識モデルで、航空交通管制(ATCO)シナリオに特化しており、単語誤り率17.04%
音声認識 Transformers
W
jlvdoorn
1,792
5
Faster Whisper Large V1
MIT
これはOpenAI Whisper large-v1モデルのCTranslate2変換バージョンで、効率的な音声認識タスクに使用されます
音声認識 複数言語対応
F
guillaumekln
237
4
Uzbek Stt
Apache-2.0
Oyqizチームによって開発されたウズベク語自動音声認識(ASR)モデル、Common Voice 10.0データセットでトレーニング
音声認識 Transformers その他
U
oyqiz
425
5
Whisper Kannada Tiny
Apache-2.0
openai/whispertinyを微調整したカンナダ語自動音声認識モデルで、複数の公開カンナダ語ASRコーパスでトレーニング済み
音声認識 その他
W
vasista22
119
6
Whisper Tiny
Apache-2.0
Whisper TinyはOpenAIが開発した自動音声認識(ASR)モデルで、Whisperシリーズの中で最も小さいバージョンであり、パラメータ規模は39Mです。
音声認識 複数言語対応
W
openai
328.82k
318
Wav2vec2 Xls R Hindi
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをヒンディー語Common Voice 7.0データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers その他
W
shivam
19
1
Wav2vec2 Large Xlsr 53 Punjabi
Apache-2.0
これはHarveenchadha/vakyansh-wav2vec2-punjabi-pam-10をベースにCommon Voiceデータセットでファインチューニングしたパンジャーブ語自動音声認識モデルです
音声認識 Transformers その他
W
kingabzpro
189
2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase