モデル選定

ヒンディー語音声認識

# ヒンディー語音声認識

Indicwav2vec Hindi

Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識モデル、AI4Bharatによって開発

Transformers その他

Whisper Large V3 Vaani Hindi

OpenAIのWhisper-Large-V3モデルをファインチューニングしたヒンディー語音声認識モデルで、約718時間のヒンディー語音声データで訓練されています

Indicconformer Stt Hi Hybrid Ctc Rnnt Large

IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識(ASR)モデルで、ヒンディー語音声の文字起こしをサポートします。

音声認識その他

Indic Whisper Nodcil

IndicWhisperはインド言語に最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。

音声認識その他

Indic Whisper Hi Multi Gpu

IndicWhisperはインド言語向けに最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。

音声認識その他

Indicwav2vec Odia

Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、AI4Bharatによって開発

Transformers その他

Whisper Hindi Large V2

OpenAI Whisper-large-v2を微調整したヒンディー語音声認識モデルで、複数の公開ヒンディー語ASRコーパスでトレーニング済み

音声認識その他

Whisper Hindi Small

OpenAI Whisper-smallをファインチューニングしたヒンディー語音声認識モデルで、複数の公開ASRコーパスでトレーニング済み

音声認識その他

Whisper Large V2 Hindi 2.5k Steps

これはOpenAI Whisper Large V2モデルをファインチューニングしたヒンディー語自動音声認識(ASR)モデルで、Common Voice 11.0データセットでトレーニングされ、単語誤り率(WER)は10.05%です。

Transformers その他

Whisper Large V2 Hi V3

OpenAI Whisper Large-v2モデルをファインチューニングしたヒンディー語音声認識モデルで、Common Voice 11.0ヒンディー語テストセットで11.3%の単語誤り率を達成

Transformers その他

Wav2vec2 Large Xls R 300m Hindi Epochs15 Colab

これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceデータセットで微調整した音声認識モデルで、ヒンディー語をサポートしています。

Wav2vec2 Large Xls R 300m Hindi Colab

facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたヒンディー語音声認識モデル

SSL Harveen Chadda Fine Tuning

このモデルはHarveenchadha/vakyansh-wav2vec2-hindi-him-4200を未知のデータセットでファインチューニングした音声認識モデルで、ヒンディー語をサポートし、評価セットで10.08%の単語誤り率を達成しました。

Gram Vaani Harveen Chadda Fine Tuning

これはHarveenchadha/vakyansh-wav2vec2-hindi-him-4200をベースにファインチューニングされた音声認識モデルで、ヒンディー語音声からテキストへの変換タスクをサポートします。

Wav2vec2 Large Xls R 300m Hindi Colab

このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたバージョンで、主にヒンディー語音声認識タスクに使用されます。

Wav2vec2hindiasr

Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、公開音声データセットでファインチューニング済み

facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデル

Wav2vec2 Large Hindicone

このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデルで、ヒンディー語をサポートしています。

Wav2vec2 Large Xls R 300m Hindi Home Colab 11

このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたヒンディー語音声認識モデルです

Wav2vec2 Large Xlsr Hindi Demo Colab

このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、ヒンディー語音声認識タスク用です。

Wav2vec2 Xls R Hindi

これはfacebook/wav2vec2-xls-r-300mをヒンディー語Common Voice 7.0データセットでファインチューニングした自動音声認識(ASR)モデルです

Transformers その他

Wav2vec2 Large Xls R 300m Hindi

これはFacebookのwav2vec2-xls-r-300mモデルをヒンディー語音声データセットでファインチューニングした自動音声認識(ASR)モデルです

Transformers その他

Xlsr 53 Wav2vec Hi

facebook/wav2vec2-large-xlsr-53をベースに微調整されたヒンディー語音声認識モデルで、低リソースのインド言語の多言語およびコードスイッチングASRチャレンジのデータで訓練されました。

Transformers その他

Wav2vec2 Large Xls R 300m Hindi

これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語データセットでファインチューニングした音声認識モデルで、ヒンディー語音声からテキストへの変換タスクをサポートします。

Transformers その他

Wav2vec2 Large Xlsr Hindi Colab

facebook/wav2vec2-large-xlsr-53をベースに、common_voiceデータセットで微調整したヒンディー語音声認識モデル

Wav2vec2 Large Xlsr Hindi

facebook/wav2vec2-large-xlsr-53を低リソースのインド言語データセットでファインチューニングしたヒンディー語自動音声認識モデル

Transformers その他

Wav2vec2 Large Xls R 300m Hindi

これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceデータセットでファインチューニングしたヒンディー語音声認識モデルです

Wav2vec2 Large Xlsr Hindi

facebook/wav2vec2-large-xlsr-53をベースに微調整されたヒンディー語音声認識モデルで、16kHzサンプリングレートの音声入力に対応しています。

Transformers その他

Wave2vec2 Large Xlsr Hindi

facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングしたヒンディー語音声認識モデルで、OpenSLRとCommon Voiceのヒンディー語データセットを使用して訓練され、16kHzサンプリングレートの音声入力をサポートします。

Transformers その他

Wav2vec2 Large Xls R 300m My Hindi Presentation Colab

facebook/wav2vec2 - xls - r - 300mをベースに、common_voiceデータセットで微調整した音声認識モデル

Wav2vec2 Large Xls R 300m Hindi Colab

このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたバージョンで、ヒンディー語音声認識タスク用です。

Wav2vec2 Large Xls R 300m My Hindi Home Colab

このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたバージョンで、音声認識タスクに適しています。

Wav2vec2 Large Xls R 300m My Hindi Home Latest Colab

このモデルはfacebook/wav2vec2-large-xlsr-53を汎用音声データセットでファインチューニングしたバージョンで、主に音声認識タスクに使用されます。

Wav2vec2 Large Xls R 300m Hindi Colab

facebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたヒンディー語音声認識モデル

Wav2vec2 Large Xlsr Hindi Commonvoice

このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、主にヒンディー語音声認識タスクに使用されます。

Hindi Wav2vec2 Stt

Wav2Vec2アーキテクチャに基づくヒンディー語音声認識モデルで、音声を直接テキストに変換します。

Hindi Large Wav2vec2

これはヒンディー語に特化した自動音声認識モデルで、Common Voiceなどのデータセットで良好な性能を発揮します。

Transformers その他

Wav2vec2 Large Xls R 300m Hi D3

これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語データセットで微調整した自動音声認識(ASR)モデルで、ヒンディー語音声認識タスクに特化しています。

Transformers その他

Wav2vec2 Large Xls R 300m Hindi Kaggle

common_voiceデータセットを基に訓練されたヒンディー語音声認識モデル

Transformers その他

Wav2vec2 Large Xls R 300m Hi CV7

これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語Common Voice 7.0データセットでファインチューニングした自動音声認識モデルです。

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase