# 16kHzサンプリングレート

Wav2vec2 Large Xlsr Sundanese
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングしたスンダ語音声認識モデル。トレーニングデータはOpenSLRの高品質TTSデータセットを使用
音声認識 その他
W
cahya
339
0
Vits Icelandic Rosa Female Monospeaker
これはfacebook/mms-tts-islをファインチューニングしたアイスランド語テキスト音声変換モデルで、Talrómurデータセットを使用して訓練され、女性の声の合成に特化しています。
音声合成 Transformers その他
V
Sigurdur
22
0
Whisper Medium Cv11 German Ct2
Apache-2.0
OpenAIのwhisper-mediumモデルをCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers ドイツ語
W
mkenfenheuer
21
1
Whisper Medium Medical De AUT
Whisper Mediumアーキテクチャを基に微調整したドイツ語医療分野の音声認識モデルで、特にオーストリア標準ドイツ語の発音に最適化されています
音声認識 Transformers ドイツ語
W
valhofec
20
2
Vits Eng
MIT
VITSアーキテクチャに基づく英語テキスト音声合成モデル、Kakao Enterpriseがトレーニング、高品質な音声合成をサポート
音声合成 Transformers 英語
V
BricksDisplay
28
4
Whisper Small Japanese
Apache-2.0
このモデルはopenai/whisper-smallをファインチューニングした日本語音声認識モデルで、日本語音声からテキストへの変換タスクをサポートします。
音声認識 Transformers 日本語
W
Ivydata
356
5
Whisper Base Japanese
Apache-2.0
このモデルは、Common Voice、JVS、JSUTデータセットを使用してopenai/whisper-baseを日本語向けにファインチューニングしたもので、日本語音声認識タスクに適しています。
音声認識 Transformers 日本語
W
Ivydata
137
3
Wav2vec2 Large Xlsr 53 Japanese
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースにファインチューニングした日本語音声認識モデル、16kHzサンプリングレートの音声入力をサポート
音声認識 Transformers 日本語
W
Ivydata
19
4
Whisper Large V2 Cv11 German
Apache-2.0
openai/whisper-large-v2をCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデルで、ドイツ語音声をテキストに変換可能、単語誤り率5.76
音声認識 Transformers ドイツ語
W
bofenghuang
179
16
Wav2vec2 Large Chinese Zh Cn
Apache-2.0
XLSR-53大規模モデルをファインチューニングした中国語音声認識モデル、16kHzサンプリングレートの音声入力をサポート
音声認識 Transformers 中国語
W
wbbbbb
585
40
Exp W2v2t Zh Cn Wavlm S596
Apache-2.0
microsoft/wavlm-largeモデルを基にファインチューニングした中国語音声認識モデルで、簡体字中国語をサポートし、Common Voice 7.0 (zh-CN)データセットでトレーニングされています。
音声認識 Transformers
E
jonatasgrosman
22
1
Exp W2v2t Fa Hubert S801
Apache-2.0
facebook/hubert-large-ll60kモデルをファインチューニングしたペルシャ語自動音声認識モデルで、Common Voice 7.0ペルシャ語データセットを使用してトレーニングされました。
音声認識 Transformers その他
E
jonatasgrosman
16
0
Exp W2v2t Sv Se Vp Nl S842
Apache-2.0
これはfacebook/wav2vec2-large-nl-voxpopuliモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、Common Voice 7.0 (sv-SE)データセットを使用してトレーニングされました。
音声認識 Transformers
E
jonatasgrosman
16
0
Exp W2v2t Sv Se Wavlm S42
Apache-2.0
microsoft/wavlm-largeをベースに微調整されたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力に適しています。
音声認識 Transformers
E
jonatasgrosman
20
0
Exp W2v2t Fr Xls R S250
Apache-2.0
facebook/wav2vec2-xls-r-300mモデルをベースに、Common Voice 7.0フランス語データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers フランス語
E
jonatasgrosman
20
0
Exp W2v2t Fr Vp Fr S438
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliモデルを基にファインチューニングしたフランス語自動音声認識モデルで、Common Voice 7.0フランス語データセットでトレーニングされています。
音声認識 Transformers フランス語
E
jonatasgrosman
20
0
Exp W2v2t Fr Unispeech S42
Apache-2.0
microsoft/unispeech-large-1500h-cvモデルをベースに、Common Voice 7.0(フランス語)データセットでファインチューニングした音声認識モデル
音声認識 Transformers フランス語
E
jonatasgrosman
20
0
Exp W2v2t It No Pretraining S842
Apache-2.0
ランダム初期化されたwav2vec2モデルを基にファインチューニングを行い、イタリア語音声認識タスク用に開発されました。トレーニングデータにはCommon Voice 7.0(イタリア語)のトレーニングセット分割部分を使用しています。
音声認識 Transformers その他
E
jonatasgrosman
18
0
Exp W2v2t It Xlsr 53 S387
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識 Transformers その他
E
jonatasgrosman
18
0
Exp W2v2t It Vp 100k S449
Apache-2.0
facebook/wav2vec2-large-100k-voxpopuliモデルを基にファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識 Transformers その他
E
jonatasgrosman
17
0
Exp W2v2t It Wav2vec2 S609
Apache-2.0
facebook/wav2vec2-large-lv60モデルをベースにファインチューニングしたイタリア語自動音声認識モデル、Common Voice 7.0イタリア語データセットでトレーニング済み。
音声認識 Transformers その他
E
jonatasgrosman
18
0
Exp W2v2t Ja Vp It S544
Apache-2.0
facebook/wav2vec2-large-it-voxpopuliモデルをベースに、Common Voice 7.0(日本語版)のトレーニングセットを使用して音声認識のファインチューニングを行った日本語自動音声認識モデルです。
音声認識 Transformers 日本語
E
jonatasgrosman
18
0
Exp W2v2t Ja Unispeech Sat S884
Apache-2.0
microsoft/unispeech-sat-largeモデルをベースにファインチューニングした日本語自動音声認識モデルで、Common Voice 7.0日本語データセットでトレーニングされています。
音声認識 Transformers 日本語
E
jonatasgrosman
19
0
Exp W2v2t Ja Wavlm S729
Apache-2.0
microsoft/wavlm-largeモデルをファインチューニングした日本語自動音声認識モデル、Common Voice 7.0日本語データセットで学習
音声認識 Transformers 日本語
E
jonatasgrosman
15
2
Exp W2v2t Ja Unispeech S569
Apache-2.0
microsoft/unispeech-large-1500h-cvモデルをベースに、Common Voice 7.0(日本語)データセットを使用して音声認識のファインチューニングを行った日本語自動音声認識モデル
音声認識 Transformers 日本語
E
jonatasgrosman
14
0
Exp W2v2t Ja Xlsr 53 S109
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした日本語自動音声認識モデル、Common Voice 7.0日本語データセットで学習
音声認識 Transformers 日本語
E
jonatasgrosman
20
0
Exp W2v2t Th Hubert S533
Apache-2.0
facebook/hubert-large-ll60kをベースにファインチューニングしたタイ語音声認識モデル、トレーニングデータはCommon Voice 7.0から取得
音声認識 Transformers その他
E
jonatasgrosman
19
0
Exp W2v2t Th Wav2vec2 S664
Apache-2.0
facebook/wav2vec2-large-lv60モデルをファインチューニングしたタイ語音声認識モデル、Common Voice 7.0データセットでトレーニング
音声認識 Transformers その他
E
jonatasgrosman
14
0
Exp W2v2t En Unispeech Sat S459
Apache-2.0
マイクロソフトのUniSpeech-SAT-Largeモデルをファインチューニングした英語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers 英語
E
jonatasgrosman
22
0
Exp W2v2t En Vp Nl S281
Apache-2.0
facebook/wav2vec2-large-nl-voxpopuliモデルを基に微調整した英語音声認識モデルで、Common Voice 7.0トレーニングセットを使用して学習されています。
音声認識 Transformers 英語
E
jonatasgrosman
18
0
Exp W2v2t En No Pretraining S289
Apache-2.0
これは英語音声認識タスク向けのモデルで、ランダム初期化されたwav2vec2アーキテクチャを基に、Common Voice 7.0データセットでファインチューニングされています。
音声認識 Transformers 英語
E
jonatasgrosman
18
0
Wav2vec2 Large Tedlium
Apache-2.0
TEDLIUMコーパスでファインチューニングされたWav2Vec2大型音声認識モデル、英語音声からテキストへの変換をサポート
音声認識 英語
W
sanchit-gandhi
58
1
Sharif Wav2vec2
MIT
Sharif Wav2vec2のペルシャ語向けファインチューニング版で、Common Voiceのペルシャ語サンプルでトレーニングされ、自動音声認識タスクをサポートします。
音声認識 Transformers その他
S
SLPL
88
16
Wav2vec2 Large Xlsr 53 Chinese Zn Cn Aishell1
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに中国語AISHELL-1データセットでファインチューニングした音声認識モデルで、中国語音声認識タスクをサポートします。
音声認識 Transformers 中国語
W
qinyue
22
6
Data2vec Audio Large 960h
Apache-2.0
Data2Vecは音声、視覚、言語タスクに適用可能な汎用自己教師あり学習フレームワークです。この音声大規模モデルはLibriSpeechの960時間音声データで事前学習とファインチューニングされ、自動音声認識タスク向けに最適化されています。
音声認識 Transformers 英語
D
facebook
2,531
7
Wav2vec2 Base Da Ft Nst
Apache-2.0
NSTデータセットでファインチューニングされたデンマーク語音声認識モデル、16kHzサンプリングレートの音声入力をサポート
音声認識 Transformers その他
W
Alvenir
15
3
Wav2vec2 Large Xlsr Dutch
Apache-2.0
Facebookのwav2vec2-large-xlsr-53モデルを基に、Common Voiceオランダ語データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers その他
W
simonsr
26
0
Wav2vec2 Xls R 1b Portuguese
Apache-2.0
これはXLS-R 1Bアーキテクチャに基づくポルトガル語自動音声認識モデルで、複数のポルトガル語音声データセットでファインチューニングされています。
音声認識 Transformers その他
W
jonatasgrosman
648.50k
12
English Model
facebook/wav2vec2-largeモデルをベースに、Common Voiceデータセットを使用して英語向けにファインチューニングされた音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。
音声認識 Transformers
E
tanmayplanet32
30
0
Wav2vec2 Large Xlsr 53 Slovenian
Apache-2.0
これはFacebookのwav2vec2-large-xlsr-53モデルをファインチューニングしたスロベニア語自動音声認識モデルで、Common Voiceデータセットで訓練され、単語誤り率は36.04%です。
音声認識 その他
W
anton-l
15.02k
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase