W

Wav2vec2hindiasr

SAGAR4REALによって開発
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、公開音声データセットでファインチューニング済み
ダウンロード数 31
リリース時間 : 3/30/2022

モデル概要

このモデルはWav2Vec2-large-xlsr-hindiを公開音声データセットでファインチューニングしたバージョンで、ヒンディー語音声認識タスク専用です。

モデル特徴

ヒンディー語音声認識
ヒンディー語に最適化された音声認識能力
Wav2Vec2アーキテクチャ採用
FacebookのWav2Vec2アーキテクチャを採用し、強力な音声特徴抽出能力を有する
大規模事前学習
XLSR(クロスリンガル音声表現)モデルに基づく事前学習

モデル能力

ヒンディー語音声からテキストへ
音声認識
自動音声転写

使用事例

音声転写
ヒンディー語音声転写
ヒンディー語音声コンテンツをテキストに変換
音声アシスタント
ヒンディー語音声コマンド認識
ヒンディー語音声アシスタントや音声制御アプリケーションに使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase