W

Wav2vec2 Large Xlsr Kn

amoghsgopadiによって開発
これはFacebookのwav2vec2-large-xlsr-53モデルをカンナダ語で微調整した自動音声認識(ASR)モデルで、OpenSLR SLR79データセットを使用して訓練されています。
ダウンロード数 2,200
リリース時間 : 3/2/2022

モデル概要

このモデルはカンナダ語の音声認識タスクに特化しており、カンナダ語の音声をテキストに変換することができます。

モデル特徴

カンナダ語専用
カンナダ語に特化して最適化された音声認識モデル
XLSR - 53ベース
強力なwav2vec2-large-xlsr-53アーキテクチャに基づいて構築されています
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力をサポートします

モデル能力

カンナダ語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
カンナダ語音声文字起こし
カンナダ語の音声内容をテキストに変換します
OpenSLRテストセットで27.08%のWERを達成しました
音声アシスタント
カンナダ語音声コマンド認識
カンナダ語の音声アシスタントまたは音声制御システムの音声認識コンポーネントに使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase