W

Wav2vec2 Large Xls R 300m Ia

ayameRushiaによって開発
facebook/wav2vec2-xls-r-300mをCommon Voice 8.0国際語データセットでファインチューニングした自動音声認識モデル
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルは国際語に最適化された自動音声認識(ASR)モデルで、Common Voice 8.0データセットでファインチューニングされ、音声をテキストに変換する機能をサポートします。

モデル特徴

高性能音声認識
Common Voice 8.0国際語テストセットで8.6074%の単語誤り率(WER)と2.4147%の文字誤り率(CER)を達成
言語モデルサポート
言語モデルを使用したデコードをサポートし、認識精度を大幅に向上
大規模事前学習モデルベース
facebook/wav2vec2-xls-r-300mモデルをファインチューニングし、強力な音声特徴抽出能力を継承

モデル能力

音声からテキストへの変換
国際語音声認識
言語モデルデコードのサポート

使用事例

音声文字起こし
国際語音声文字起こし
国際語の音声コンテンツをテキストに変換
テストセットで8.6074%の単語誤り率を達成
音声アシスタント
国際語音声コマンド認識
国際語の音声コマンドを認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase