W

Wav2vec2 Large Xlsr Punjabi

Developed by manandey
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、パンジャーブ語音声データでファインチューニングした自動音声認識(ASR)モデルです。
Downloads 20.46k
Release Time : 3/2/2022

Model Overview

このモデルはパンジャーブ語の音声認識タスク専用に設計されており、Common Voiceデータセットでトレーニングされ、16kHzサンプリングレートの音声入力をサポートします。

Model Features

パンジャーブ語音声認識
パンジャーブ語に最適化された音声認識能力
XLSR大規模モデルベース
facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしており、強力な音声特徴抽出能力を有する
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理可能

Model Capabilities

音声認識
パンジャーブ語音声からテキストへの変換

Use Cases

音声文字起こし
パンジャーブ語音声文字起こし
パンジャーブ語音声をテキストに変換
単語誤り率57.31%
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase