W

Wav2vec2 Large Xlsr Japanese 0325 1200

qqpannによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、日本語音声認識タスク向けにファインチューニングした自動音声認識(ASR)モデルです。
ダウンロード数 14
リリース時間 : 3/2/2022

モデル概要

このモデルは日本語音声認識に特化しており、Common Voiceデータセットでファインチューニングされており、日本語音声をテキストに変換できます。

モデル特徴

日本語音声認識
日本語に最適化された音声認識能力
XLSR大規模モデルベース
facebook/wav2vec2-large-xlsr-53大規模モデルを基にファインチューニングされており、強力な音声特徴抽出能力を有する
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理可能

モデル能力

日本語音声認識
音声からテキストへ
自動音声認識

使用事例

音声文字起こし
日本語音声文字起こし
日本語音声コンテンツをテキスト形式に変換
音声アシスタント
日本語音声コマンド認識
日本語音声アシスタントのコマンド認識システムに使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase