Distil Whisper Large V3 Es
MIT
Whisper v3大規模モデルを蒸留したスペイン語音声認識モデル、SandboxAIとUniversidad Nacional de Rio Negroの共同開発
音声認識
Transformers スペイン語

D
marianbasti
64
10
Asr Wav2vec2 Commonvoice 14 Es
Apache-2.0
これはCommonVoiceスペイン語データセットでトレーニングされたエンドツーエンド自動音声認識システムで、wav2vec 2.0事前トレーニングモデルとCTCデコーダーを組み合わせています。
音声認識 スペイン語
A
speechbrain
22
3
Whisper Large V2 Spanish
Apache-2.0
OpenAI Whisper-large-v2モデルをCommon Voice 13.0スペイン語データセットでファインチューニングした音声認識モデル
音声認識
Transformers

W
Sandiago21
38
3
Whisper Large V2 Spanish
Apache-2.0
openai/whisper-large-v2を微調整したスペイン語音声認識モデル、Common Voice 11.0スペイン語テストセットでWER8.55%を達成
音声認識
Transformers

W
clu-ling
85
2
Whisper Small Spanish
Apache-2.0
このモデルは、OpenAIのwhisper-smallをCommon Voiceデータセットv11スペイン語版でファインチューニングした音声認識モデルで、スペイン語の文字起こしタスクに特化しています。
音声認識
Transformers

W
clu-ling
298
1
Whisper Tiny Es
Apache-2.0
OpenAI Whisper-tinyモデルをスペイン語データセットで微調整した音声認識モデル
音声認識
Transformers スペイン語

W
arpagon
26
3
Wav2vec2 Large Xlsr 53 Spanish Ep5 944h
スペイン語自動音声認識用の音響モデルで、facebook/wav2vec2-large-xlsr-53を5エポックにわたってファインチューニングし、約944時間のスペイン語データを使用しています。
音声認識
Transformers スペイン語

W
carlosdanielhernandezmena
111
3
Stt Es Conformer Transducer Large
これはスペイン語自動音声認識用の大型Conformer-トランスデューサーモデルで、約1.2億パラメータを持ち、1340時間のスペイン語音声データでトレーニングされています。
音声認識 スペイン語
S
nvidia
708
4
Stt Es Conformer Ctc Large
これはNVIDIAがトレーニングし公開した、スペイン語自動音声認識(ASR)用の大型Conformer-CTCモデルです。
音声認識 スペイン語
S
nvidia
59
2
Wav2vec2 Large Xlsr Es Col Pro Noise
Apache-2.0
jonatasgrosman/wav2vec2-large-xlsr-53-spanishをベースにファインチューニングしたスペイン語音声認識モデルで、コロンビアアクセントとノイズ環境に最適化されています
音声認識
Transformers

W
Santiagot1105
18
0
Wav2vec2 Large Xlsr Es Col Pro
Apache-2.0
jonatasgrosman/wav2vec2-large-xlsr-53-spanishをベースにファインチューニングしたスペイン語(コロンビア)音声認識モデル
音声認識
Transformers

W
Santiagot1105
20
0
Wav2vec2 Large Xlsr Es Col Test
Apache-2.0
これはjonatasgrosman/wav2vec2-large-xlsr-53-spanishモデルを特定のデータセットでファインチューニングしたスペイン語音声認識モデルです。
音声認識
Transformers

W
Santiagot1105
30
1
Wav2vec2 Spanish
Common Voiceのスペイン語データで事前学習された音声認識モデル、Flaxフレームワークを使用しTPUでトレーニング
音声認識 スペイン語
W
flax-community
16
2
Wav2vec2 Large Xlsr 53 Spanish With Lm
Apache-2.0
これはWav2Vec2-Large-XLSR-53をベースにしたスペイン語音声認識モデルで、言語モデルサポートを追加することで認識精度が大幅に向上しています。
音声認識 スペイン語
W
patrickvonplaten
2,198
8
Wav2vec2 Xls R 300m Cv8 Es
Apache-2.0
facebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングした音声認識モデル
音声認識
Transformers

W
edugp
23
0
Wav2vec2 Base Es Voxpopuli V2
Wav2Vec2の基礎モデルで、スペイン語の21.4kの無ラベルデータのみで事前学習され、音声認識タスクに適しています。
音声認識
Transformers スペイン語

W
facebook
46
1
Wav2vec2 Large Xls R 300m Spanish Custom
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceスペイン語データセットでファインチューニングした音声認識モデルで、評価セットで21.17%の単語誤り率を達成しました。
音声認識
Transformers

W
tomascufaro
15
0
Wav2vec2 Latino40
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声認識モデルで、ラテン語系の音声処理をサポート
音声認識
Transformers

W
cristinakuo
17
0
Wav2vec2 Large Xlsr 53 Spanish
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、スペイン語のCommon Voiceデータセットで微調整された自動音声認識(ASR)モデルです。
音声認識 スペイン語
W
mrm8488
38
2
Wav2vec2 Large Es Voxpopuli
VoxPopuliコーパスのスペイン語サブセットでトレーニングされた大規模音声事前学習モデルで、スペイン語音声認識タスクに適しています
音声認識 スペイン語
W
facebook
117.04k
1
Wav2vec2 Xls R 300m Es
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをCOMMON_VOICE - ESデータセットでファインチューニングしたスペイン語自動音声認識モデルです。
音声認識
Transformers スペイン語

W
samitizerxu
23
0
Wav2vec2 Base 10k Voxpopuli Ft Es
Facebook Wav2Vec2基本モデルを基に、VoxPopuliコーパスの10K未ラベルサブセットで事前学習し、スペイン語書き起こしデータでファインチューニングした音声認識モデルです。
音声認識
Transformers スペイン語

W
facebook
34
1
Wav2vec2 Base Es Voxpopuli
VoxPopuliスペイン語無注釈データで事前学習されたWav2Vec2音声認識基本モデル
音声認識
Transformers スペイン語

W
facebook
39
2
Wav2vec2 Large Xlsr 53 Spanish
Apache-2.0
FacebookがリリースしたWav2Vec2アーキテクチャに基づく大規模な多言語音声認識モデルで、スペイン語に特化して最適化されています
音声認識 スペイン語
W
facebook
66.63k
20
Xls R Spanish Test
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルをスペイン語Common Voice 7データセットで微調整した自動音声認識(ASR)モデルです。
音声認識
Transformers スペイン語

X
pablouribe
29
0
Base Spanish Asr
汎用音声データセットでトレーニングされたスペイン語音声認識モデル、wav2vec2アーキテクチャを採用
音声認識
Transformers

B
glob-asr
19
0
Wav2vec2 Large Xls R 300m Spanish Small
wav2vec2-large-xls-r-300mアーキテクチャに基づくスペイン語音声認識モデルで、汎用音声データセットで微調整され、単語誤り率(WER)は0.1791です。
音声認識
Transformers

W
tomascufaro
13
0
Wav2vec2 Large Xlsr 53 Es
Apache-2.0
Facebookのwav2vec2-large-xlsr-53モデルをベースに、スペイン語Common Voiceデータセットで微調整した音声認識モデルで、テストWERは10.50%です。
音声認識
Transformers スペイン語

W
pcuenq
147
0
Wav2vec2 Large Xlsr 53 Spanish
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを基に微調整されたスペイン語音声認識モデルで、Common Voice 6.1スペイン語データセットで訓練されました。
音声認識 スペイン語
W
jonatasgrosman
46.28k
30
Xls R 300m Es
Apache-2.0
スペイン語Common Voiceデータセットでファインチューニングされた音声認識モデル。facebook/wav2vec2-xls-r-300mアーキテクチャ採用。テストセットでWER14.6%を達成
音声認識
Transformers スペイン語

X
polodealvarado
23
4
Wav2vec2 Large Xls R 300m Spanish Small
これはwav2vec2アーキテクチャに基づくスペイン語音声認識モデルで、Common Voiceデータセットでファインチューニングされており、単語誤り率(WER)は0.2105です。
音声認識
Transformers

W
glob-asr
58
0
Wav2vec2 Xls R 1b Spanish
Apache-2.0
これはXLS-R 10億パラメータモデルをファインチューニングしたスペイン語自動音声認識モデルで、複数のスペイン語データセットで学習・最適化されています。
音声認識
Transformers スペイン語

W
jonatasgrosman
2,270
6
Wav2vec2 Lar Xlsr Es Col
Apache-2.0
このモデルは、jonatasgrosman/wav2vec2-large-xlsr-53-spanishをベースに微調整されたバージョンで、スペイン語の音声認識タスクに使用されます。
音声認識
Transformers

W
Santiagot1105
26
0
Wav2vec2 Lar Xlsr Finetune Es Col
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をベースに微調整されたスペイン語(コロンビアアクセント)の音声認識モデルで、評価セットでの単語誤り率(WER)は0.2595です。
音声認識
Transformers

W
Santiagot1105
26
0
Wav2vec2 Large Xlsr Finetune Es Col
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53を特定のスペイン語データセットで微調整した音声認識モデルです。
音声認識
Transformers

W
Santiagot1105
17
0
Wav2vec2 Large Xlsr 53 Spanish
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたスペイン語自動音声認識(ASR)モデルで、Common Voiceスペイン語データセットで訓練され、16kHzのサンプリングレートの音声入力をサポートします。
音声認識 スペイン語
W
LuisG07
50
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98