W

Wav2vec2 Large Xlsr Japanese Hiragana

vumichienによって開発
facebook/wav2vec2-large-xlsr-53モデルを微調整した日本語音声認識モデルで、ひらがな出力をサポート
ダウンロード数 90
リリース時間 : 3/2/2022

モデル概要

このモデルは日本語音声認識タスク向けに最適化されたWav2Vec2モデルで、日本語音声をひらがなテキストに変換できます。

モデル特徴

ひらがな出力
モデルの出力は日本語ひらがな形式で、後処理が容易
複数データソースでの学習
Common VoiceとJSUT日本語音声コーパスを使用して学習
言語モデル不要
追加の言語モデルサポートなしで直接使用可能

モデル能力

日本語音声認識
音声からテキストへの変換
ひらがな変換

使用事例

音声文字起こし
日本語音声の転記
日本語音声コンテンツをひらがなテキストに変換
WER 24.74%, CER 10.99%
音声アシスタント
日本語音声コマンド認識
日本語音声コマンドを認識してテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase