W

Wav2vec2 11

chrisvinsenによって開発
facebook/wav2vec2-baseを微調整した音声認識モデルで、自動音声テキスト変換タスクをサポート
ダウンロード数 18
リリース時間 : 5/23/2022

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声認識モデルで、微調整後に音声をテキストに変換するタスクに使用可能

モデル特徴

wav2vec2アーキテクチャ採用
Facebookが開発したwav2vec2-baseを基本アーキテクチャとして採用し、優れた音声特徴抽出能力を有する
微調整最適化
特定のデータセットで微調整を行い、特定の音声特徴や分野に最適化されている可能性がある
低単語誤り率
評価結果では単語誤り率(WER)が1.0と良好な性能を示す

モデル能力

音声認識
自動音声テキスト変換

使用事例

音声文字起こし
会議議事録
会議録音を自動的に文字記録に変換
単語誤り率1.0
音声メモ
音声メモを編集可能なテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase