W

Wav2vec2 Large Xls R 300m Hi D3

DrishtiSharmaによって開発
これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語データセットで微調整した自動音声認識(ASR)モデルで、ヒンディー語音声認識タスクに特化しています。
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルはヒンディー語に最適化された自動音声認識モデルで、Common Voice 7.0ヒンディー語データセットで微調整され、ヒンディー語音声をテキストに変換するのに使用できます。

モデル特徴

ヒンディー語最適化
ヒンディー語音声認識に特化して最適化と微調整が行われました
大規模モデルベース
facebook/wav2vec2-xls-r-300m大規模モデルをベースに構築されています
良好な性能
Common Voice 7.0テストセットでWERが42.04%、CERが13.87%です。

モデル能力

ヒンディー語音声認識
音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
ヒンディー語音声文字起こし
ヒンディー語音声内容をテキストに変換する
WER 42.04%, CER 13.87%
音声アシスタント
ヒンディー語音声アシスタント
ヒンディー語に対応した音声アシスタントを構築するために使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase