W

Wav2vec2 Base De Voxpopuli V2

facebookによって開発
Facebook Wav2Vec2アーキテクチャに基づくドイツ語音声事前学習モデルで、VoxPopuliコーパスの23.2kの未ラベルドイツ語データを使用して事前学習されています。
ダウンロード数 44
リリース時間 : 3/2/2022

モデル概要

このモデルは基礎的な音声処理モデルで、ドイツ語音声認識タスクに特化しており、自己教師あり学習により生の音声から特徴を抽出します。

モデル特徴

ドイツ語専用事前学習
ドイツ語音声データに特化して事前学習されており、ドイツ語音声特徴抽出能力が最適化されています。
自己教師あり学習
Wav2Vec2の自己教師あり学習手法を使用し、大量の未ラベル音声データから効果的な表現を学習します。
16kHz音声サポート
モデルは16kHzサンプリングの音声で事前学習されており、使用時には入力音声のサンプリングレートが一致している必要があります。

モデル能力

ドイツ語音声特徴抽出
音声表現学習

使用事例

音声処理
ドイツ語音声認識システム
このモデルをファインチューニングしてドイツ語自動音声認識システムを構築
最適な性能を得るには追加のラベルデータによるファインチューニングが必要です
音声特徴抽出器
下流の音声タスクの特徴抽出器として使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase