W

Wav2vec2 Large Xlsr Hindi Marathi

tanmaylaudによって開発
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングし、ヒンディー語とマラーティー語の自動音声認識タスクをサポート
ダウンロード数 76
リリース時間 : 3/2/2022

モデル概要

このモデルはヒンディー語とマラーティー語に最適化された自動音声認識(ASR)モデルで、OpenSLR SLR64データセットを使用してファインチューニングされており、16kHzサンプリングレートの音声入力に適しています。

モデル特徴

多言語サポート
ヒンディー語とマラーティー語というインドの主要2言語の音声認識を同時にサポート
XLSR事前学習ベース
Facebookの強力なwav2vec2-large-xlsr-53モデルをベースにファインチューニングされており、優れた言語横断表現能力を有する
オープンソースデータセットで訓練
OpenSLRの公開データセットを使用して訓練されており、モデルの透明性と再現性を確保

モデル能力

音声からテキストへの変換
ヒンディー語音声認識
マラーティー語音声認識
16kHzオーディオ処理

使用事例

音声文字起こし
会議議事録
ヒンディー語またはマラーティー語の会議録音を文字記録に変換
単語誤り率約23.7%(OpenSLRテストセット)
音声アシスタント
ヒンディー語またはマラーティー語ユーザー向けに音声インタラクション機能を提供
教育アプリケーション
言語学習ツール
学習者がヒンディー語またはマラーティー語の発音を練習するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase