W

Wav2vec2 Large Xlsr 53 Telugu

Developed by anuragshas
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたテルグ語音声認識モデルで、OpenSLR SLR66データセットを使用してトレーニング
Downloads 44.24k
Release Time : 3/2/2022

Model Overview

これはテルグ語向けの自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャに基づいており、テルグ語音声をテキストに変換するのに適しています。

Model Features

テルグ語専用
テルグ語に特化して最適化された音声認識モデル
XLSR事前学習モデルベース
大規模なクロスランゲージ音声表現学習(XLSR)の事前学習知識を活用
言語モデル不要
追加の言語モデルサポートなしで直接使用可能

Model Capabilities

テルグ語音声認識
16kHz音声処理

Use Cases

音声からテキストへ
テルグ語音声文字起こし
テルグ語音声コンテンツをテキストに変換
OpenSLRテストセットで44.98% WERを達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase