Wav2vec2 Large Xlsr 53 Hungarian
Apache-2.0
facebook/wav2vec2-large-xlsr-53を基に、ハンガリー語Common Voiceデータセットでファインチューニングした自動音声認識モデル
音声認識
Transformers その他

W
sarpba
17
1
Whisper Uz
Apache-2.0
OpenAI Whisper Mediumモデルをファインチューニングしたウズベク語自動音声認識モデル
音声認識
Transformers その他

W
mustafoyev202
110
1
Disper Small Salam
Apache-2.0
OpenAI Whisper-smallをファインチューニングしたアラビア語音声認識モデル
音声認識
Transformers アラビア語

D
Duino
14
1
Whisper Medium Cv11 German Ct2
Apache-2.0
OpenAIのwhisper-mediumモデルをCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデル
音声認識
Transformers ドイツ語

W
mkenfenheuer
21
1
Whisper Uz
Apache-2.0
Whisper Baseをファインチューニングしたウズベク語音声認識モデル、Common Voiceデータセットでトレーニング済み
音声認識
Transformers その他

W
jamshidahmadov
1,179
3
Whisper Small Uzbek
Apache-2.0
OpenAI Whisper-smallをファインチューニングしたウズベク語自動音声認識モデル、Common Voice 17.0データセットでトレーニング
音声認識
Transformers その他

W
abduaziz
20
2
Whisper Large V3 Turbo Es
MIT
Whisper-large-v3-turboをファインチューニングしたスペイン語音声認識モデル。Common Voice 17.0スペイン語データセットで単語誤り率を5.34%まで低減
音声認識
Transformers スペイン語

W
adriszmar
52
4
Whisper Tiny Chinese
Apache-2.0
OpenAI Whisper TinyモデルをCommon Voice 11.0中国語データセットでファインチューニングした音声認識モデル
音声認識
Transformers 中国語

W
jethrowang
99
1
Whisper Large V3 Az
Apache-2.0
このモデルはOpenAIのWhisper Large v3をアゼルバイジャン語のCommon Voice 17.0データセットでファインチューニングした自動音声認識(ASR)モデルで、1.195%の単語誤り率(WER)を達成しました。
音声認識
Transformers その他

W
nsalahaddinov
96
1
Whisper Large V3 Turkish Test1
Apache-2.0
OpenAI Whisper-large-v3モデルをCommon Voice 17.0トルコ語データセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

W
erdiyalcin
21
3
Whisper Small Turkish V2
Apache-2.0
OpenAI Whisper-smallモデルをトルコ語Common Voiceデータセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

W
atakanince
61
2
Training V2
Apache-2.0
OpenAI Whisper-baseモデルをCommon Voice 11.0ロシア語データセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

T
SofiaK
15
1
Speecht5 Finetuned Commonvoice Ru Translit
MIT
microsoft/speecht5_ttsをCommon Voice 13データセットでファインチューニングしたロシア語テキスト音声変換モデル
音声合成
Transformers その他

S
voxxer
57
2
Speecht5 Finetuned Common Voice Be
MIT
Microsoft SpeechT5アーキテクチャに基づくベラルーシ語テキスト音声変換モデル、Common Voiceデータセットでファインチューニング済み
音声合成
Transformers その他

S
KoRiF
27
0
Speecht5 Tts Common Voice Uk
MIT
Microsoft SpeechT5アーキテクチャを基にCommon Voiceデータセットでファインチューニングしたウクライナ語テキスト音声変換モデル
音声合成
Transformers その他

S
ewigeki
47
3
Speecht5 Tts Common Voice 5 Sv
MIT
マイクロソフトのSpeechT5アーキテクチャをファインチューニングしたスウェーデン語テキスト音声変換モデル、Common Voiceデータセットでトレーニング
音声合成
Transformers その他

S
GreenCounsel
27
1
Whisper Medium Turkish 2
Apache-2.0
OpenAI Whisper Mediumをファインチューニングしたトルコ語音声認識モデル、Common Voice 11.0データセットでトレーニング
音声認識
Transformers その他

W
emre
267
15
Whisper Large V2 Hungarian
Apache-2.0
OpenAI Whisper Large-V2モデルをハンガリー語Common Voiceデータセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

W
DrishtiSharma
21
1
Whisper Large V2 Serbian
Apache-2.0
これはOpenAI Whisper Large-V2モデルをセルビア語Common Voice 11.0データセットでファインチューニングした音声認識モデルで、単語誤り率は10.76%です。
音声認識
Transformers その他

W
DrishtiSharma
39
3
Whisper Large V2 Hausa
Apache-2.0
このモデルはOpenAIのWhisper Large-V2をハウサ語音声認識タスク用にファインチューニングしたバージョンで、Common Voice 11.0データセットでトレーニングされています
音声認識
Transformers その他

W
DrishtiSharma
44
5
Whisper Large V2 Slovenian
Apache-2.0
このモデルはOpenAIのWhisper Large-V2モデルをCommon Voice 11.0スロベニア語データセットでファインチューニングした音声認識モデルで、単語誤り率は13.83%です。
音声認識
Transformers その他

W
DrishtiSharma
53
1
Whisper Large V2 Hindi 2.5k Steps
Apache-2.0
これはOpenAI Whisper Large V2モデルをファインチューニングしたヒンディー語自動音声認識(ASR)モデルで、Common Voice 11.0データセットでトレーニングされ、単語誤り率(WER)は10.05%です。
音声認識
Transformers その他

W
DrishtiSharma
52
2
Whisper Large V2 Bn
Apache-2.0
OpenAI Whisper Large-v2モデルをベンガル語音声データセットでファインチューニングした自動音声認識(ASR)モデル
音声認識
Transformers その他

W
anuragshas
319
6
Whisper Large V2 Ta
Apache-2.0
OpenAI Whisper Large-v2モデルをファインチューニングしたタミル語自動音声認識(ASR)モデルで、Common Voice 11.0タミル語テストセットで8.45%の単語誤り率を達成
音声認識
Transformers その他

W
anuragshas
15
1
Whisper Large V2 Malayalam
Apache-2.0
これはOpenAI Whisper Large V2モデルをマラヤーラム語音声認識タスク用にファインチューニングしたバージョンで、Common Voice 11.0データセットでトレーニングされています
音声認識
Transformers その他

W
DrishtiSharma
23
4
Whisper Large Pt Cv11
Apache-2.0
OpenAIのWhisper-large-v2モデルをポルトガル語Common Voice 11データセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

W
jonatasgrosman
155
13
Whisper Large V2 Hi V3
Apache-2.0
OpenAI Whisper Large-v2モデルをファインチューニングしたヒンディー語音声認識モデルで、Common Voice 11.0ヒンディー語テストセットで11.3%の単語誤り率を達成
音声認識
Transformers その他

W
anuragshas
21
1
Whisper Large V2 Punjabi
Apache-2.0
OpenAI Whisper-large-v2をファインチューニングしたパンジャーブ語自動音声認識モデル、Common Voice 11.0データセットでトレーニング
音声認識
Transformers その他

W
DrishtiSharma
27
1
Whisper Large V2 Vietnamese
Apache-2.0
このモデルはOpenAIのWhisper Smallアーキテクチャを基に、Common Voice 11.0ベトナム語データセットでファインチューニングされた自動音声認識(ASR)モデルです
音声認識
Transformers その他

W
DrishtiSharma
25
2
Whisper Large V2 Cantonese
Apache-2.0
OpenAI Whisper Large V2を広東語データセットでファインチューニングした自動音声認識モデルで、テストセットで6.7274%の文字誤り率を達成
音声認識
Transformers その他

W
simonl0909
131
12
Whisper Medium French
Apache-2.0
openai/whisper-mediumをcommon_voice_11_0データセットでファインチューニングしたフランス語音声認識モデルで、標準化WERは11.1406を達成し、オリジナルモデルを上回ります。
音声認識
Transformers フランス語

W
pierreguillou
260
9
Exp W2v2t Sv Se R Wav2vec2 S418
Apache-2.0
facebook/wav2vec2-large-robustモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識
Transformers

E
jonatasgrosman
32
0
Exp W2v2t Sv Se Vp Nl S842
Apache-2.0
これはfacebook/wav2vec2-large-nl-voxpopuliモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、Common Voice 7.0 (sv-SE)データセットを使用してトレーニングされました。
音声認識
Transformers

E
jonatasgrosman
16
0
Exp W2v2t Fr Xls R S250
Apache-2.0
facebook/wav2vec2-xls-r-300mモデルをベースに、Common Voice 7.0フランス語データセットでファインチューニングした自動音声認識モデル
音声認識
Transformers フランス語

E
jonatasgrosman
20
0
Exp W2v2t Fr Vp Fr S438
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliモデルを基にファインチューニングしたフランス語自動音声認識モデルで、Common Voice 7.0フランス語データセットでトレーニングされています。
音声認識
Transformers フランス語

E
jonatasgrosman
20
0
Exp W2v2t Fr Unispeech S42
Apache-2.0
microsoft/unispeech-large-1500h-cvモデルをベースに、Common Voice 7.0(フランス語)データセットでファインチューニングした音声認識モデル
音声認識
Transformers フランス語

E
jonatasgrosman
20
0
Exp W2v2t It Vp Fr S821
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliモデルをファインチューニングしたイタリア語自動音声認識モデル、Common Voice 7.0イタリア語データセットでトレーニング
音声認識
Transformers その他

E
jonatasgrosman
27
0
Exp W2v2t It Vp 100k S449
Apache-2.0
facebook/wav2vec2-large-100k-voxpopuliモデルを基にファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識
Transformers その他

E
jonatasgrosman
17
0
Exp W2v2t Ja Vp It S544
Apache-2.0
facebook/wav2vec2-large-it-voxpopuliモデルをベースに、Common Voice 7.0(日本語版)のトレーニングセットを使用して音声認識のファインチューニングを行った日本語自動音声認識モデルです。
音声認識
Transformers 日本語

E
jonatasgrosman
18
0
Exp W2v2t Ja Unispeech Sat S884
Apache-2.0
microsoft/unispeech-sat-largeモデルをベースにファインチューニングした日本語自動音声認識モデルで、Common Voice 7.0日本語データセットでトレーニングされています。
音声認識
Transformers 日本語

E
jonatasgrosman
19
0
- 1
- 2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98