W

Wav2vec2 Base Japanese Asr

TKU410410103によって開発
rinna/japanese-wav2vec2-baseをcommon_voice_11_0日本語データセットでファインチューニングした音声認識モデル、ひらがな出力のみ対応
ダウンロード数 68
リリース時間 : 4/14/2024

モデル概要

これは日本語音声認識モデルで、日本語音声に特化して最適化されており、日本語音声をひらがなテキストに変換できます。

モデル特徴

日本語専用音声認識
日本語音声に特化して最適化された認識モデル
ひらがな出力
モデルの出力はひらがな形式で、日本語テキスト処理に適しています
wav2vec2アーキテクチャ採用
効率的なwav2vec2-baseアーキテクチャを使用してトレーニング

モデル能力

日本語音声認識
音声からテキストへ
ひらがな変換

使用事例

音声文字起こし
日本語音声から文字へ
日本語音声コンテンツをひらがなテキストに変換
common_voice_11_0テストセットでWER 14.18%
音声アシスタント
日本語音声コマンド認識
日本語音声コマンドを認識してテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase