# スウェーデン語音声認識

Kb Whisper Tiny
Apache-2.0
スウェーデン国立図書館が公開したWhisperモデルで、スウェーデン語音声認識に特化して最適化されており、OpenAIのオリジナル版と比べて誤り率が大幅に低下しています。
音声認識 Transformers その他
K
KBLab
1,791
2
Kb Whisper Small
Apache-2.0
スウェーデン国立図書館が公開したWhisperモデルで、スウェーデン語に最適化されており、50,000時間以上のスウェーデン語音声データでトレーニングされ、OpenAIのオリジナル版を上回る性能
音声認識 Transformers その他
K
KBLab
28.61k
3
Kb Whisper Medium
Apache-2.0
スウェーデン国立図書館が5万時間以上のスウェーデン語音声で訓練したWhisperモデルで、スウェーデン語音声認識タスクで優れた性能を発揮
音声認識 Transformers その他
K
KBLab
691
3
Kb Whisper Large
Apache-2.0
スウェーデン国立図書館が公開したWhisperアーキテクチャに基づくスウェーデン語音声認識モデルで、5万時間以上のトレーニングデータを使用し、単語誤り率を大幅に低減しています。
音声認識 Transformers その他
K
KBLab
8,880
42
Exp W2v2t Sv Se R Wav2vec2 S418
Apache-2.0
facebook/wav2vec2-large-robustモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers
E
jonatasgrosman
32
0
Exp W2v2t Sv Se Vp Nl S842
Apache-2.0
これはfacebook/wav2vec2-large-nl-voxpopuliモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、Common Voice 7.0 (sv-SE)データセットを使用してトレーニングされました。
音声認識 Transformers
E
jonatasgrosman
16
0
Exp W2v2t Sv Se Wavlm S42
Apache-2.0
microsoft/wavlm-largeをベースに微調整されたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力に適しています。
音声認識 Transformers
E
jonatasgrosman
20
0
Wav2vec2 Large Voxrex Swedish 4gram
これはスウェーデン語の自動音声認識(ASR)用モデルで、VoxRex-C音響モデルとソーシャルメディアデータに基づく4-gram言語モデルを統合しています。
音声認識 Transformers その他
W
viktor-enzell
5,891
5
Xls R 300 Sv Cv7
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをスウェーデン語Common Voice 7.0データセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers その他
X
patrickvonplaten
19
0
Xls R 300m Sv Robust
これはKBLab/wav2vec2-large-voxrexを基に、スウェーデン語Common Voiceデータセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers その他
X
marinone94
27
1
Wav2vec2 Swedish Common Voice
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルをベースに、スウェーデン語のCommon Voiceデータセットで微調整された音声認識モデルで、学習データ量は402MBです。
音声認識 その他
W
birgermoell
24
1
Wav2vec2 Large Xlsr Swedish
Apache-2.0
これはXLSR-53アーキテクチャに基づくスウェーデン語自動音声認識モデルで、Common Voiceデータセットでファインチューニングされています。
音声認識 その他
W
marma
24
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をCOMMON_VOICE SV-SEデータセットでファインチューニングした自動音声認識(ASR)モデルで、スウェーデン語音声認識をサポートします。
音声認識 Transformers
W
birgermoell
17
0
Wav2vec2 Speechdat
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をベースに、COMMON_VOICE - SV-SEデータセットで微調整されたスウェーデン語自動音声認識モデルです。
音声認識 Transformers
W
birgermoell
29
0
Wav2vec2 Base Sv Voxpopuli V2
Facebook Wav2Vec2アーキテクチャに基づく音声モデルで、スウェーデン語に特化して事前学習されており、VoxPopuliコーパスの16.3kの未ラベルデータを使用しています。
音声認識 Transformers その他
W
facebook
30
0
Wav2vec2 Large Xls R 1b Swedish
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-1bをCommon Voiceのスウェーデン語データセットで微調整した自動音声認識モデルで、スウェーデン語の音声をテキストに変換するタスクをサポートしています。
音声認識 Transformers その他
W
kingabzpro
844
1
Wav2vec2 Base Sv Voxpopuli
VoxPopuliコーパスのスウェーデン語サブセットで事前学習されたWav2Vec2ベースモデルで、スウェーデン語音声認識タスクに適しています。
音声認識 Transformers その他
W
facebook
33
0
Xls R 300m It Cv8
このモデルはCommon Voiceスウェーデン語データセットを使用してfacebook/wav2vec2-xls-r-300mをファインチューニングした音声認識モデルで、評価セットで1.0286の単語誤り率(WER)を達成しました。
音声認識 Transformers
X
masapasa
19
1
Xls R 300m Sv
Apache-2.0
facebook/wav2vec2-xls-r-300mをベースに、スウェーデン語データセットで微調整した自動音声認識モデル
音声認識 Transformers その他
X
hf-test
28
3
Wav2vec2 Base Voxpopuli Sv Swedish
FacebookのVoxPopuli-svベース版モデルをベースに、NSTとCommon Voiceのデータを使って微調整されたスウェーデン語音声認識モデルです。
音声認識 Transformers
W
KBLab
38
0
Wav2vec2 Large Voxrex Swedish
VoxRex大型モデルを微調整したスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers その他
W
KBLab
101.28k
12
Wav2vec2 Large Voxpopuli Sv Swedish
このモデルはFacebookのVoxPopuli-sv largeモデルをベースに、スウェーデンのラジオ番組、NST、Common Voiceのデータを追加で事前学習と微調整したスウェーデン語音声認識モデルです。
音声認識
W
KBLab
38.78k
0
Wav2vec2 Large Xlsr 53 Swedish
Apache-2.0
facebook/wav2vec2-large-xlsr - 53フレームワークに基づいて微調整されたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 その他
W
KBLab
30.51k
3
Wav2vec2 Large Xlsr 53 Swedish
Apache-2.0
これは、facebook/wav2vec2-large-xlsr-53モデルをベースに、スウェーデン語のCommon Voiceデータセットで微調整された自動音声認識(ASR)モデルです。
音声認識
W
MehdiHosseiniMoghadam
24
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase