W

Wav2vec2 Xls R Pa IN A1

DrishtiSharmaによって開発
Facebookのwav2vec2-xls-r-300mモデルをCommon Voice 8.0のパンジャブ語(インド)データセットで微調整した自動音声認識モデル
ダウンロード数 20
リリース時間 : 3/2/2022

モデル概要

このモデルは、パンジャブ語(インド方言)の音声認識タスクに特化しており、音声をテキストに変換できます。

モデル特徴

高精度認識
評価セットで0.4908の単語誤り率(WER)を達成しました。
大規模事前学習
Facebookのwav2vec2-xls-r-300mモデルを微調整しており、強力な音声特徴抽出能力を持っています。
特定言語最適化
パンジャブ語(インド方言)に特化して最適化訓練を行っています。

モデル能力

音声からテキストへの変換
パンジャブ語(インド)音声認識
リアルタイム音声処理

使用事例

音声書き起こし
音声メモの書き起こし
パンジャブ語(インド)の音声メモを検索可能なテキストに変換します。
精度約51% (WER 0.4908)
支援技術
音声制御アプリケーション
パンジャブ語ユーザ向けに開発された音声制御インターフェース
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase