W

Wav2vec2 Xlsr Punjabi

gagan3012によって開発
facebook/wav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットでパンジャーブ語にファインチューニングした自動音声認識モデル
ダウンロード数 2,433
リリース時間 : 3/2/2022

モデル概要

これはパンジャーブ語に最適化された自動音声認識モデルで、パンジャーブ語の音声をテキストに変換できます。

モデル特徴

高精度パンジャーブ語認識
パンジャーブ語に特化して最適化された音声認識能力
XLSR大規模モデルベース
強力なwav2vec2-large-xlsr-53モデルをファインチューニング
16kHzサンプリングレート対応
標準16kHzサンプリングレートの音声入力をサポート

モデル能力

パンジャーブ語音声認識
音声からテキストへ
自動音声認識

使用事例

音声文字起こし
パンジャーブ語音声を文字に変換
パンジャーブ語の音声コンテンツを編集可能なテキストに変換
単語誤り率58.06%
音声アシスタント
パンジャーブ語音声インタラクション
パンジャーブ語ユーザー向けの音声インタラクション機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase