V

Vakyansh Wav2vec2 Hindi Him 4200

Harveenchadhaによって開発
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識モデルで、Harveen Chadhaによって開発され、4200時間のラベル付きヒンディー語データで微調整されました。
ダウンロード数 2,621
リリース時間 : 3/2/2022

モデル概要

このモデルは、ヒンディー語に最適化された自動音声認識(ASR)システムで、FacebookのWav2Vec2アーキテクチャに基づき、CLSRIL - 23多言語事前学習モデルを基に微調整されています。

モデル特徴

大規模なヒンディー語データで訓練
4200時間のラベル付きヒンディー語データを基に微調整
多言語事前学習の基礎
CLSRIL - 23多言語事前学習モデルを基に微調整
言語モデル不要
追加の言語モデルなしで、生のモデルを直接推論に使用できます。

モデル能力

ヒンディー語音声認識
16kHzオーディオ処理

使用事例

音声書き起こし
ヒンディー語音声をテキストに変換
ヒンディー語の音声内容をテキストに変換
Common Voiceヒンディー語テストセットでのWERは33.17%です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase