W

Wav2vec2 Large Xls R 300m Hindi Colab

nimrahによって開発
facebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたヒンディー語音声認識モデル
ダウンロード数 16
リリース時間 : 3/2/2022

モデル概要

このモデルはwav2vec2-xls-r-300mのファインチューニング版で、ヒンディー語音声認識タスクに特化しています。

モデル特徴

大規模事前学習モデルを基にしたファインチューニング
facebook/wav2vec2-xls-r-300mを基にファインチューニングし、元のモデルの強力な特徴抽出能力を引き継いでいます。
ヒンディー語最適化
ヒンディー語音声認識タスクに特化して最適化されています。
効率的な学習
混合精度学習や勾配累積などの技術を使用して学習効率を向上させています。

モデル能力

ヒンディー語音声認識
音声をテキストに変換

使用事例

音声文字起こし
ヒンディー語音声文字起こし
ヒンディー語の音声内容をテキストに変換する
音声アシスタント
ヒンディー語音声指令認識
ヒンディー語対応の音声アシスタントシステムに使用する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase