W

Wav2vec2 Large Uralic Voxpopuli V2

facebookによって開発
VoxPopuliコーパスの42.5時間のウラル語族の無ラベルデータで事前学習されたWav2Vec2大型音声モデル
ダウンロード数 46
リリース時間 : 3/2/2022

モデル概要

これはFacebookのWav2Vec2アーキテクチャに基づく大型音声モデルで、ウラル語族に特化して事前学習され、音声認識タスクに適しています。

モデル特徴

ウラル語族専用
ウラル語族に特化して事前学習され、この語族の音声認識タスクに適しています
VoxPopuliコーパスに基づく
VoxPopuli多言語音声コーパスの42.5時間のウラル語族データを使用して事前学習されました
16kHzオーディオ対応
モデルの事前学習には16kHzのサンプリングレートの音声オーディオが使用されており、使用時には入力オーディオがこのサンプリングレートに一致するようにする必要があります

モデル能力

音声特徴抽出
音声表現学習

使用事例

音声技術
ウラル語族の音声認識
ウラル語族の自動音声認識システムの開発に使用できます
ラベル付きデータで微調整する必要があり、その後で最適な結果が得られます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase