W

Wav2vec2 Xls R 1b Japanese

vumichienによって開発
このモデルは、facebook/wav2vec2-xls-r-1bを公共の日本語音声データセットで微調整したバージョンで、日本語の自動音声認識タスクをサポートします。
ダウンロード数 50
リリース時間 : 3/2/2022

モデル概要

これは日本語に最適化された自動音声認識モデルで、wav2vec2-xls-r-1bアーキテクチャに基づき、Common Voiceなどの日本語音声データセットで微調整されています。

モデル特徴

高性能な日本語認識
Common Voice 7.0テストセットで7.98%のWERと3.42%のCERを達成しました。
複数データセットによる訓練
Common Voice、JUST、JSSS、CSS10などの複数の日本語音声データセットを統合しています。
言語モデルのサポート
4-gram言語モデルと組み合わせて使用でき、認識精度を大幅に向上させます。

モデル能力

日本語音声認識
音声をテキストに変換
長い音声データの処理をサポート

使用事例

音声文字起こし
日本語音声を文字に変換
日本語の音声内容をテキストに変換します。
Common Voiceテストセットで7.88 - 7.98%の単語誤り率を達成しました。
音声分析
日本語音声内容の分析
日本語の音声内容を分析し、重要な情報を抽出します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase