W

Wav2vec2 Xls R 300m Demo Colab

Mahalakshmiによって開発
このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットで微調整した音声認識モデルです。
ダウンロード数 16
リリース時間 : 3/2/2022

モデル概要

音声認識タスク用の微調整モデルで、wav2vec2-xls-r-300mアーキテクチャに基づき、common_voiceデータセットで訓練されました。

モデル特徴

効率的な微調整
事前学習されたwav2vec2-xls-r-300mモデルを基に微調整し、common_voiceデータセットで良好な結果を得ました。
良好な性能
評価セットで1.0377の単語誤り率を達成し、優れた性能を発揮しました。
高速推論
毎秒25.239個のサンプルを処理でき、推論速度が速いです。

モデル能力

音声認識
音声をテキストに変換

使用事例

音声文字起こし
音声を文字に変換
音声内容を文字記録に変換します。
単語誤り率1.0377
音声アシスタント
音声命令認識
ユーザーの音声命令を認識します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase