W

Wav2vec2 1

chrisvinsenによって開発
このモデルはfacebook/wav2vec2-baseをファインチューニングした音声認識モデルで、評価セットで0.4949の単語誤り率を達成しました。
ダウンロード数 16
リリース時間 : 5/22/2022

モデル概要

wav2vec2-1はwav2vec2アーキテクチャに基づく音声認識モデルで、主に音声をテキストに変換するために使用されます。

モデル特徴

wav2vec2アーキテクチャ採用
先進的なwav2vec2アーキテクチャを使用して音声認識タスクを実行
ファインチューニング最適化
ベースモデルをファインチューニングし、特定のシナリオでの認識精度を向上
比較的低い単語誤り率
評価セットで0.4949の単語誤り率を達成

モデル能力

音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
会議議事録
会議の録音を自動的に文字記録に変換
音声メモ
音声メモを編集可能なテキストに変換
支援技術
聴覚支援
聴覚障害者向けにリアルタイムの音声から文字への変換サービスを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase