W

Wav2vec2 Large Xls R 300m Hindi

infinitejoyによって開発
これはFacebookのwav2vec2-xls-r-300mモデルをヒンディー語音声データセットでファインチューニングした自動音声認識(ASR)モデルです
ダウンロード数 13
リリース時間 : 3/2/2022

モデル概要

このモデルはヒンディー語音声認識タスク専用に設計され、Common Voice 7ヒンディー語データセットでファインチューニングされています

モデル特徴

ヒンディー語音声認識
ヒンディー語に最適化された音声認識能力
XLS-Rアーキテクチャベース
Facebookの強力なXLS-R 3億パラメータモデルを基盤として使用
Common Voiceデータセットでファインチューニング
Mozilla Common Voice 7.0ヒンディー語データセットでファインチューニングを実施

モデル能力

ヒンディー語音声からテキストへ
自動音声認識
音声内容の書き起こし

使用事例

音声書き起こし
ヒンディー語音声書き起こし
ヒンディー語音声内容をテキストに変換
テストWER 100、テストCER 92.98
音声アシスタント
ヒンディー語音声コマンド認識
ヒンディー語音声アシスタントや音声制御システムの音声認識コンポーネントとして使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase