# 音声翻訳

Whisper Large V3 Turbo
MIT
WhisperはOpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルで、500万時間以上のラベル付きデータでトレーニングされ、強力なゼロショット汎化能力を備えています。Turboバージョンはオリジナルのプルーニングおよび微調整バージョンで、デコード層を32層から4層に削減し、速度が大幅に向上していますが、品質はわずかに低下しています。
音声認識 Transformers 複数言語対応
W
unsloth
94
1
Whisper Large V3 Turbo Gguf
MIT
Whisper large-v3-turboはWhisper large-v3を基にしたプルーニングと微調整バージョンで、デコード層数を32から4に削減し、速度が大幅に向上しましたが、品質はわずかに低下しています。
音声認識 複数言語対応
W
xkeyC
546
1
Whisper Large V3 Turbo
MIT
Whisper large-v3-turboはOpenAIが提案した自動音声認識および音声翻訳モデルで、大規模な弱教師あり学習に基づき、複数言語をサポートしています。
音声認識 Transformers 複数言語対応
W
Daemontatox
26
1
Whisper Large V3 Turbo
MIT
WhisperはOpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルで、500万時間以上のラベル付きデータでトレーニングされ、ゼロショット設定において強力な汎化能力を発揮します。
音声認識 Transformers 複数言語対応
W
openai
4.0M
2,317
Canary 1b
Canary-1BはNVIDIA NeMoが開発した多言語マルチタスクモデルで、英語、ドイツ語、フランス語、スペイン語の自動音声認識と音声翻訳タスクをサポートします。
音声認識 複数言語対応
C
nvidia
7,734
421
Whisper Large V3
Apache-2.0
WhisperはOpenAIが提案した先進的な自動音声認識(ASR)および音声翻訳モデルで、500万時間以上の注釈付きデータで訓練されており、強力なデータセット間およびドメイン間の汎化能力を持っています。
音声認識 複数言語対応
W
openai
4.6M
4,321
Whisper Large V2
Apache-2.0
Whisperは事前学習済みの自動音声認識(ASR)および音声翻訳モデルで、68万時間の注釈付きデータでトレーニングされ、強力な汎化能力を備えています
音声認識 複数言語対応
W
openai
176.55k
1,725
Whisper Large
Apache-2.0
Whisperは、自動音声認識(ASR)と音声翻訳に使用される事前学習モデルで、68万時間のラベル付きデータで学習され、強力な汎化能力を持っています。
音声認識 複数言語対応
W
openai
175.34k
512
Unit Hifigan Mhubert Vp En Es Fr It3 400k Layer11 Km1000 Lj Dur
fairseq S2UTベースの音声から音声への翻訳モデルで、スペイン語から英語への翻訳をサポート
音声合成 英語
U
facebook
27
18
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase