W

Wav2vec2 Live Japanese

Developed by ttop324
facebook/wav2vec2-large-xlsr-53を微調整した日本語音声認識モデルで、平仮名出力に対応しています。
Downloads 20
Release Time : 3/2/2022

Model Overview

これは日本語に最適化された自動音声認識(ASR)モデルで、日本語の音声を平仮名テキストに変換することができます。モデルは複数の日本語音声データセットで微調整されており、日本語の音声文字起こしタスクに適しています。

Model Features

複数データセットの微調整
common_voice、JSUT、CSS10、TEDxJP - 10K、JVS、JSSSなどの複数の日本語音声データセットで微調整されました。
平仮名出力
日本語の平仮名変換に特化して最適化されており、標準化された平仮名テキストを出力することができます。
高性能
Common Voiceの日本語テストセットで21.48%のWERと9.82%のCERを達成しました。

Model Capabilities

日本語音声認識
音声をテキストに変換
平仮名変換

Use Cases

音声文字起こし
日本語音声をテキストに変換
日本語の音声内容を平仮名テキストに変換します。
21.48% WERの正解率
支援ツール
リアルタイム字幕生成
日本語のビデオやライブ配信にリアルタイム字幕を生成します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase