W

Wav2vec2 Large Xlsr Javanese

cahyaによって開発
facebook/wav2vec2-large-xlsr-53をファインチューニングしたジャワ語自動音声認識モデルで、トレーニングデータはOpenSLRの高品質ジャワ語TTSデータを使用しています。
ダウンロード数 659
リリース時間 : 3/2/2022

モデル概要

これはジャワ語に最適化された自動音声認識モデルで、ジャワ語の音声をテキストに変換できます。

モデル特徴

高品質ジャワ語認識
ジャワ語に特化して最適化された音声認識モデルで、OpenSLRデータセットで17.61%のWERを達成しています。
XLSR事前学習モデルベース
facebook/wav2vec2-large-xlsr-53をファインチューニングしており、大規模なクロスランゲージ音声表現学習を活用しています。
言語モデル不要
追加の言語モデルサポートなしで直接使用できます。

モデル能力

ジャワ語音声認識
自動音声テキスト変換

使用事例

音声書き起こし
ジャワ語音声転写
ジャワ語の音声コンテンツをテキスト形式に変換
テストセットで17.61%の単語誤り率を達成
音声アシスタント
ジャワ語音声インタラクション
ジャワ語をサポートする音声アシスタントアプリケーションの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase