W

Wav2vec2 3

chrisvinsenによって開発
facebook/wav2vec2-baseを微調整した音声認識モデルで、単語誤り率(WER)は1.0
ダウンロード数 16
リリース時間 : 5/22/2022

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声認識モデルで、微調整後に音声からテキストへの変換タスクに使用可能

モデル特徴

低単語誤り率
評価データセットで1.0の単語誤り率(WER)を達成
wav2vec2アーキテクチャベース
facebook/wav2vec2-baseをベースモデルとして微調整

モデル能力

音声認識
音声からテキストへの変換

使用事例

音声文字起こし
会議議事録
会議の録音を文字記録に変換
音声メモ
音声メモをテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase