# ヒンディー語音声認識

Indicwav2vec Hindi
Apache-2.0
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識モデル、AI4Bharatによって開発
音声認識 Transformers その他
I
ai4bharat
34.90k
17
Whisper Large V3 Vaani Hindi
Apache-2.0
OpenAIのWhisper-Large-V3モデルをファインチューニングしたヒンディー語音声認識モデルで、約718時間のヒンディー語音声データで訓練されています
音声認識 Safetensors
W
ARTPARK-IISc
15.55k
3
Indicconformer Stt Hi Hybrid Ctc Rnnt Large
MIT
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識(ASR)モデルで、ヒンディー語音声の文字起こしをサポートします。
音声認識 その他
I
ai4bharat
1,694
3
Indic Whisper Nodcil
MIT
IndicWhisperはインド言語に最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。
音声認識 その他
I
parthiv11
253
3
Indic Whisper Hi Multi Gpu
MIT
IndicWhisperはインド言語向けに最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。
音声認識 その他
I
parthiv11
72
4
Indicwav2vec Odia
Apache-2.0
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、AI4Bharatによって開発
音声認識 Transformers その他
I
ai4bharat
401
2
Whisper Hindi Large V2
Apache-2.0
OpenAI Whisper-large-v2を微調整したヒンディー語音声認識モデルで、複数の公開ヒンディー語ASRコーパスでトレーニング済み
音声認識 その他
W
vasista22
1,488
49
Whisper Hindi Small
Apache-2.0
OpenAI Whisper-smallをファインチューニングしたヒンディー語音声認識モデルで、複数の公開ASRコーパスでトレーニング済み
音声認識 その他
W
vasista22
477
26
Whisper Large V2 Hindi 2.5k Steps
Apache-2.0
これはOpenAI Whisper Large V2モデルをファインチューニングしたヒンディー語自動音声認識(ASR)モデルで、Common Voice 11.0データセットでトレーニングされ、単語誤り率(WER)は10.05%です。
音声認識 Transformers その他
W
DrishtiSharma
52
2
Whisper Large V2 Hi V3
Apache-2.0
OpenAI Whisper Large-v2モデルをファインチューニングしたヒンディー語音声認識モデルで、Common Voice 11.0ヒンディー語テストセットで11.3%の単語誤り率を達成
音声認識 Transformers その他
W
anuragshas
21
1
Wav2vec2 Large Xls R 300m Hindi Epochs15 Colab
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceデータセットで微調整した音声認識モデルで、ヒンディー語をサポートしています。
音声認識 Transformers
W
vai6hav
17
0
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたヒンディー語音声認識モデル
音声認識 Transformers
W
vai6hav
20
0
SSL Harveen Chadda Fine Tuning
MIT
このモデルはHarveenchadha/vakyansh-wav2vec2-hindi-him-4200を未知のデータセットでファインチューニングした音声認識モデルで、ヒンディー語をサポートし、評価セットで10.08%の単語誤り率を達成しました。
音声認識 Transformers
S
rajat99
30
0
Gram Vaani Harveen Chadda Fine Tuning
MIT
これはHarveenchadha/vakyansh-wav2vec2-hindi-him-4200をベースにファインチューニングされた音声認識モデルで、ヒンディー語音声からテキストへの変換タスクをサポートします。
音声認識 Transformers
G
nnair25
30
0
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたバージョンで、主にヒンディー語音声認識タスクに使用されます。
音声認識 Transformers
W
nikhil6041
25
0
Wav2vec2hindiasr
Apache-2.0
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、公開音声データセットでファインチューニング済み
音声認識 Transformers
W
SAGAR4REAL
31
1
Wav2vec2hindia
Apache-2.0
facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
SAGAR4REAL
22
0
Wav2vec2 Large Hindicone
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデルで、ヒンディー語をサポートしています。
音声認識 Transformers
W
SAGAR4REAL
16
0
Wav2vec2 Large Xls R 300m Hindi Home Colab 11
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたヒンディー語音声認識モデルです
音声認識 Transformers
W
nimrah
22
0
Wav2vec2 Large Xlsr Hindi Demo Colab
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、ヒンディー語音声認識タスク用です。
音声認識 Transformers
W
nikhil6041
19
0
Wav2vec2 Xls R Hindi
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをヒンディー語Common Voice 7.0データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers その他
W
shivam
19
1
Wav2vec2 Large Xls R 300m Hindi
Apache-2.0
これはFacebookのwav2vec2-xls-r-300mモデルをヒンディー語音声データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers その他
W
infinitejoy
13
0
Xlsr 53 Wav2vec Hi
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに微調整されたヒンディー語音声認識モデルで、低リソースのインド言語の多言語およびコードスイッチングASRチャレンジのデータで訓練されました。
音声認識 Transformers その他
X
harshit345
38
0
Wav2vec2 Large Xls R 300m Hindi
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語データセットでファインチューニングした音声認識モデルで、ヒンディー語音声からテキストへの変換タスクをサポートします。
音声認識 Transformers その他
W
ravirajoshi
26
0
Wav2vec2 Large Xlsr Hindi Colab
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに、common_voiceデータセットで微調整したヒンディー語音声認識モデル
音声認識 Transformers
W
nvshubhsharma
17
0
Wav2vec2 Large Xlsr Hindi
facebook/wav2vec2-large-xlsr-53を低リソースのインド言語データセットでファインチューニングしたヒンディー語自動音声認識モデル
音声認識 Transformers その他
W
theainerd
1.6M
7
Wav2vec2 Large Xls R 300m Hindi
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceデータセットでファインチューニングしたヒンディー語音声認識モデルです
音声認識 Transformers
W
gagan3012
21
0
Wav2vec2 Large Xlsr Hindi
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに微調整されたヒンディー語音声認識モデルで、16kHzサンプリングレートの音声入力に対応しています。
音声認識 Transformers その他
W
skylord
82
2
Wave2vec2 Large Xlsr Hindi
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングしたヒンディー語音声認識モデルで、OpenSLRとCommon Voiceのヒンディー語データセットを使用して訓練され、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers その他
W
shiwangi27
63
1
Wav2vec2 Large Xls R 300m My Hindi Presentation Colab
Apache-2.0
facebook/wav2vec2 - xls - r - 300mをベースに、common_voiceデータセットで微調整した音声認識モデル
音声認識 Transformers
W
nimrah
22
0
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたバージョンで、ヒンディー語音声認識タスク用です。
音声認識 Transformers
W
chaitanya97
19
0
Wav2vec2 Large Xls R 300m My Hindi Home Colab
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたバージョンで、音声認識タスクに適しています。
音声認識 Transformers
W
nimrah
16
0
Wav2vec2 Large Xls R 300m My Hindi Home Latest Colab
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53を汎用音声データセットでファインチューニングしたバージョンで、主に音声認識タスクに使用されます。
音声認識 Transformers
W
nimrah
16
0
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
facebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたヒンディー語音声認識モデル
音声認識 Transformers
W
nimrah
16
0
Wav2vec2 Large Xlsr Hindi Commonvoice
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、主にヒンディー語音声認識タスクに使用されます。
音声認識 Transformers
W
nikhil6041
17
0
Hindi Wav2vec2 Stt
Wav2Vec2アーキテクチャに基づくヒンディー語音声認識モデルで、音声を直接テキストに変換します。
音声認識 Transformers
H
addy88
207
1
Hindi Large Wav2vec2
Apache-2.0
これはヒンディー語に特化した自動音声認識モデルで、Common Voiceなどのデータセットで良好な性能を発揮します。
音声認識 Transformers その他
H
Harveenchadha
1,027
1
Wav2vec2 Large Xls R 300m Hi D3
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語データセットで微調整した自動音声認識(ASR)モデルで、ヒンディー語音声認識タスクに特化しています。
音声認識 Transformers その他
W
DrishtiSharma
22
0
Wav2vec2 Large Xls R 300m Hindi Kaggle
common_voiceデータセットを基に訓練されたヒンディー語音声認識モデル
音声認識 Transformers その他
W
Saitomar
27
0
Wav2vec2 Large Xls R 300m Hi CV7
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語Common Voice 7.0データセットでファインチューニングした自動音声認識モデルです。
音声認識 Transformers その他
W
DrishtiSharma
46
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase