W

Wav2vec2 Large 100h Lv60 Self

Splend1dchanによって開発
Wav2Vec2-Large-100h-Lv60は、100時間のLibri-LightとLibrispeech音声データを用いて事前学習と微調整を行った大規模モデルで、自己訓練目標で訓練されており、16kHzサンプリングレートの音声認識タスクに適しています。
ダウンロード数 17
リリース時間 : 4/12/2022

モデル概要

このモデルは自動音声認識(ASR)モデルで、自己教師あり学習により生の音声から音声表現を学習し、限られた注釈データ下で高性能な音声認識を実現します。

モデル特徴

自己教師あり学習
自己訓練目標を用いて訓練されており、限られた注釈データ下で効果的な音声表現を学習可能
高効率音声認識
Librispeechデータセットにおいて低い単語誤り率(WER)を達成
低リソース適応
わずか10分の注釈データしかない場合でも、許容可能な認識精度を実現

モデル能力

音声認識
音響特徴抽出
英語音声文字起こし

使用事例

音声からテキストへ
会議議事録
英語の会議録音を自動的に文字起こし
ポッドキャスト文字起こし
英語ポッドキャストコンテンツを自動的にテキスト化
音声アシスタント
音声コマンド認識
英語音声コマンドの認識と理解
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase