W

Wav2vec2 Large Xlsr Sundanese

cahyaによって開発
facebook/wav2vec2-large-xlsr-53をファインチューニングしたスンダ語音声認識モデル。トレーニングデータはOpenSLRの高品質TTSデータセットを使用
ダウンロード数 339
リリース時間 : 3/2/2022

モデル概要

これはスンダ語向けの自動音声認識(ASR)モデルで、Facebookのwav2vec2-large-xlsr-53アーキテクチャをファインチューニングしており、スンダ語音声入力を認識するために特別に設計されています。

モデル特徴

高精度
OpenSLRスンダ語テストセットで6.19%の単語誤り率(WER)を達成
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理するために最適化

モデル能力

スンダ語音声認識
音声からテキストへの変換
音声処理

使用事例

音声書き起こし
スンダ語音声転写
スンダ語音声コンテンツをテキストに変換
高精度な転写結果
音声アシスタント
スンダ語音声インターフェース
スンダ語ユーザー向け音声制御機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase