# ドイツ語音声認識

Whisper Medium Cv11 German Ct2
Apache-2.0
OpenAIのwhisper-mediumモデルをCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers ドイツ語
W
mkenfenheuer
21
1
German RAG WHISPER LARGE V3 TURBO HESSIAN AI
MIT
Whisper Large v3 Turboを基に最適化されたドイツ語音声認識モデル。13時間の精選データセットで微調整され、ドイツ語認識精度が大幅に向上
音声認識 Transformers ドイツ語
G
avemio
282
1
Whisper Large V3 Turbo German Ct2
Apache-2.0
Whisper Large v3をベースとしたドイツ語音声認識モデル、ドイツ語音声処理と認識に最適化
音声認識 Transformers ドイツ語
W
jimmymeister
38
3
Whisper Large V3 Turbo German
Apache-2.0
Whisper Large v3を基にしたドイツ語音声認識のファインチューニングモデルで、ドイツ語音声処理と認識に特化して最適化されています。
音声認識 Transformers ドイツ語
W
primeline
2,777
33
Distil Whisper Large V3 German
Apache-2.0
distil-whisper技術に基づくドイツ語音声認識モデルで、パラメータ数は7.56億、高品質を維持しながらより高速な推論を実現。
音声認識 Transformers ドイツ語
D
primeline
207
15
Whisper Tiny German
Apache-2.0
whisper-tinyをベースとしたドイツ語音声認識モデルで、パラメータ数は3780万、モデルサイズに敏感なエッジシナリオに適しています。
音声認識 Transformers ドイツ語
W
primeline
198
8
Whisper Large V3 German
Apache-2.0
Whisper Large v3を基にしたドイツ語音声認識のファインチューニングモデルで、ドイツ語音声処理と認識に最適化されています
音声認識 Transformers ドイツ語
W
primeline
8,745
70
Stt De Fastconformer Hybrid Large Pc
これはFastConformerアーキテクチャに基づくドイツ語自動音声認識モデルで、トランスフォーマーとCTCのハイブリッド訓練方式を採用し、パラメータ規模は約115Mです。
音声認識 ドイツ語
S
nvidia
1,017
4
Whisper Large V2 Cv11 German
Apache-2.0
openai/whisper-large-v2をCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデルで、ドイツ語音声をテキストに変換可能、単語誤り率5.76
音声認識 Transformers ドイツ語
W
bofenghuang
179
16
Whisper Small Cv11 German
Apache-2.0
openai/whisper-smallをCommon Voice 11.0ドイツ語データセットで微調整した音声認識モデルで、ドイツ語音声をテキストに変換し、大文字小文字と句読点を予測します。
音声認識 Transformers ドイツ語
W
bofenghuang
67
7
Stt De Conformer Transducer Large
これはドイツ語の自動音声認識用の大規模なConformer-Transducerモデルで、約1.2億のパラメータを持ち、ドイツ語音声をテキストに変換します。
音声認識 ドイツ語
S
nvidia
66
6
Stt De Conformer Ctc Large
これはドイツ語自動音声認識のための大規模Conformer-CTCモデルで、NVIDIAが数千時間のドイツ語音声データでトレーニングおよび最適化しました。
音声認識 ドイツ語
S
nvidia
132
4
Wav2vec2 Large Xlsr 53 German Cv9
Apache-2.0
これはFacebookのwav2vec2-large-xlsr-53モデルを基に、ドイツ語Common Voice 9.0データセットでファインチューニングした自動音声認識(ASR)モデルです。
音声認識 Transformers ドイツ語
W
oliverguhr
98
1
Wav2vec2 Xls R 1b Tevr
Apache-2.0
これはドイツ語音声認識モデルで、wav2vec 2.0 XLS-R 1Bアーキテクチャを採用し、TEVR(マーカーエントロピー分散低減)技術を導入、5-gram言語モデルと組み合わせ、Common Voiceドイツ語テストセットで3.64%の単語誤り率を達成しました。
音声認識 Transformers ドイツ語
W
fxtentacle
311
14
Bach Arb
jonatasgrosman/wav2vec2-large-xlsr-53-germanを基にファインチューニングしたドイツ語音声認識モデル
音声認識 Transformers
B
bkh6722
30
0
Wav2vec2 Large Xls R 300m German With Lm
Apache-2.0
facebook/wav2vec2-xls-r-300mをCommon Voiceドイツ語データセットでファインチューニングした音声認識モデル、n-gram言語モデルを統合、単語誤り率8.8%
音声認識 Transformers
W
mfleck
26
1
Wav2vec2 Large Xlsr 53 German With Lm
Apache-2.0
これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、言語モデルサポートを備えており、Common Voiceドイツ語データセットで優れた性能を発揮します。
音声認識 Transformers ドイツ語
W
aware-ai
19
7
Wav2vec2 Large Xlsr German
Apache-2.0
Facebookのwav2vec2-large-xlsr-53モデルをベースに、Common Voiceドイツ語データセットで微調整された自動音声認識(ASR)モデル
音声認識 ドイツ語
W
maxidl
253
0
Wav2vec2 Large Xlsr German Demo
Apache-2.0
facebook/wav2vec2-large-xlsr-53を基にドイツ語Common Voiceデータセットでファインチューニングした音声認識モデル、単語誤り率29.35%
音声認識 ドイツ語
W
marcel
23
1
Phoneme Test 5 Sv
Apache-2.0
このモデルは、facebook/wav2vec2 - xls - r - 300mをMULTILINGUAL_LIBRISPEECH - ドイツ語10時間データセットで微調整したバージョンで、ドイツ語音声認識タスクに使用されます。
音声認識 Transformers
P
patrickvonplaten
17
0
Wav2vec2 Xlsr 300m German Truecase
Facebookのwav2vec2-xls-r-300mモデルを基に、Common Voiceドイツ語データセットでファインチューニングされ、ドイツ語音声認識をサポートしテキストの大文字小文字情報を保持します。
音声認識 Transformers
W
abnerh
16
1
Wav2vec2 Large Xlsr 53 German
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに、Common Voiceのドイツ語データセットで微調整した自動音声認識モデルで、テストのWERは15.80%です。
音声認識 ドイツ語
W
marcel
25
1
Wav2vec2 Base De Voxpopuli V2
Facebook Wav2Vec2アーキテクチャに基づくドイツ語音声事前学習モデルで、VoxPopuliコーパスの23.2kの未ラベルドイツ語データを使用して事前学習されています。
音声認識 Transformers ドイツ語
W
facebook
44
1
German Pretrained
Apache-2.0
このモデルはflozi00/wav2vec-xlsr-germanを微調整したドイツ語音声認識モデルで、評価セットでの単語誤り率は1.0です。
音声認識 Transformers
G
chaitanya97
30
0
Wav2vec2 Large Xlsr 53 German Gpt2
Apache-2.0
これはMOZILLA-FOUNDATION/COMMON_VOICE_7_0ドイツ語データセットでトレーニングされた自動音声認識エンコーダ-デコーダモデルで、Wav2Vec2とGPT2アーキテクチャの利点を組み合わせています。
音声認識 Transformers ドイツ語
W
jsnfly
28
2
Custom German
Apache-2.0
flozi00/wav2vec - xlsr - germanをベースに微調整されたドイツ語音声認識モデル
音声認識 Transformers
C
chaitanya97
24
0
Wav2vec2 Xls R 1b German
Apache-2.0
これはXLS - R 1Bアーキテクチャに基づくドイツ語自動音声認識モデルで、Common Voice 8.0などの複数のドイツ語音声データセットで微調整されています。
音声認識 Transformers ドイツ語
W
jonatasgrosman
105
3
German Trained
Apache-2.0
このモデルは、flozi00/wav2vec-xlsr-germanをベースに微調整されたドイツ語音声認識モデルで、主にドイツ語の音声をテキストに変換するタスクに使用されます。
音声認識 Transformers
G
chaitanya97
24
0
Wav2vec2 100m Mls German Ft
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-100mを多言語LibriSpeechドイツ語データセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers
W
patrickvonplaten
27
0
Wav2vec2 10july
Apache-2.0
これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、Common Voiceドイツ語データセットでファインチューニングされています。
音声認識 Transformers ドイツ語
W
sourabharsh
24
0
Wav2vec2 100m Mls German Ft 2
Apache-2.0
facebook/wav2vec2-xls-r-100mモデルをMULTILINGUAL_LIBRISPEECH - GERMANデータセットでファインチューニングしたドイツ語自動音声認識モデル
音声認識 Transformers
W
patrickvonplaten
23
0
Wav2vec2 Base 10k Voxpopuli Ft De
Facebook Wav2Vec2ベースモデルを基に、VoxPopuliコーパスの10K無注釈サブセットで事前学習し、ドイツ語転写データでファインチューニングした音声認識モデル
音声認識 Transformers ドイツ語
W
facebook
46
1
Wav2vec2 Xls R 1b De Cv8
Apache-2.0
facebook/wav2vec2-xls-r-1bをCommon Voice 8ドイツ語データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers ドイツ語
W
jsnfly
22
0
Wav2vec2 Large Xlsr 53 German
Apache-2.0
FacebookのWav2Vec2アーキテクチャに基づく大規模ドイツ語自動音声認識(ASR)モデルで、Common Voiceドイツ語データセットで微調整されています。
音声認識 ドイツ語
W
facebook
1,767
3
Wav2vec2 Large Xlsr 53 German
Apache-2.0
これはドイツ語音声認識タスクに対して微調整されたXLSR - 53の大規模モデルで、Facebookのwav2vec2-large-xlsr-53モデルをベースに、Common Voice 6.1ドイツ語データセットで微調整されました。
音声認識 ドイツ語
W
jonatasgrosman
8,266
7
Wav2vec2 Large Xlsr 53 German
wav2vec-large-xlsr-53フレームワークを基に微調整されたドイツ語音声認識モデルで、CommonVoiceドイツ語テストセットで11.26%の単語誤り率を達成しました。
音声認識
W
Noricum
33
0
Wav2vec2 Xls R 300m German De
Apache-2.0
このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、MOZILLA - FOUNDATION/COMMON_VOICE_7_0 - DEデータセットで微調整されたドイツ語自動音声認識モデルです。
音声認識 Transformers ドイツ語
W
AndrewMcDowell
72
3
Wav2vec2 Xls R 1B German
Apache-2.0
このモデルは、facebook/wav2vec2 - xls - r - 1bをMOZILLA - FOUNDATION/COMMON_VOICE_8_0 - ドイツ語データセットで微調整したバージョンで、ドイツ語の自動音声認識タスクに使用されます。
音声認識 Transformers ドイツ語
W
AndrewMcDowell
48
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase