W

Wav2vec2 Large Xlsr Japanese 0325 1200

Developed by qqpann
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、日本語音声認識タスク向けにファインチューニングした自動音声認識(ASR)モデルです。
Downloads 14
Release Time : 3/2/2022

Model Overview

このモデルは日本語音声認識に特化しており、Common Voiceデータセットでファインチューニングされており、日本語音声をテキストに変換できます。

Model Features

日本語音声認識
日本語に最適化された音声認識能力
XLSR大規模モデルベース
facebook/wav2vec2-large-xlsr-53大規模モデルを基にファインチューニングされており、強力な音声特徴抽出能力を有する
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理可能

Model Capabilities

日本語音声認識
音声からテキストへ
自動音声認識

Use Cases

音声文字起こし
日本語音声文字起こし
日本語音声コンテンツをテキスト形式に変換
音声アシスタント
日本語音声コマンド認識
日本語音声アシスタントのコマンド認識システムに使用
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase