W

Wav2vec2 Large Xlsr Indonesian Artificial

cahyaによって開発
これはfacebook/wav2vec2-large-xlsr-53をベースに微調整されたインドネシア語音声認識モデルで、人工Common Voiceインドネシア語データセットで訓練されています。
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルはインドネシア語の自動音声認識タスクに使用され、インドネシア語の音声をテキストに変換することができます。

モデル特徴

XLSR - 53をベースに微調整
モデルはfacebook/wav2vec2-large-xlsr-53アーキテクチャをベースに微調整され、その強力な音声特徴抽出能力を引き継いでいます。
インドネシア語対応
インドネシア語音声認識タスクに特化して最適化訓練されています。
16kHzサンプリングレート対応
モデルは16kHzサンプリングレートの音声入力をサポートし、ほとんどの音声認識アプリケーションシナリオに適しています。

モデル能力

インドネシア語音声認識
音声をテキストに変換

使用事例

音声文字起こし
音声メモの文字起こし
インドネシア語の音声メモを検索可能なテキスト内容に変換します。
音声アシスタント
インドネシア語音声コマンド認識
インドネシア語の音声アシスタントに音声認識機能を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase