W

Wav2vec2 Large Xlsr Punjabi

manandeyによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、パンジャーブ語音声データでファインチューニングした自動音声認識(ASR)モデルです。
ダウンロード数 20.46k
リリース時間 : 3/2/2022

モデル概要

このモデルはパンジャーブ語の音声認識タスク専用に設計されており、Common Voiceデータセットでトレーニングされ、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

パンジャーブ語音声認識
パンジャーブ語に最適化された音声認識能力
XLSR大規模モデルベース
facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしており、強力な音声特徴抽出能力を有する
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理可能

モデル能力

音声認識
パンジャーブ語音声からテキストへの変換

使用事例

音声文字起こし
パンジャーブ語音声文字起こし
パンジャーブ語音声をテキストに変換
単語誤り率57.31%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase