W

Wav2vec2 Large Slavic Voxpopuli V2

facebookによって開発
FacebookのWav2Vec2大型モデルで、スラブ語系のVoxPopuliコーパスにおいて88.99999999999999時間の未ラベルデータ事前学習を行っています。
ダウンロード数 26
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2Vec2アーキテクチャに基づく音声処理モデルで、スラブ語系に特化して事前学習されており、音声認識タスクに適しています。

モデル特徴

スラブ語系最適化
スラブ語系に特化した事前学習を行い、この語系の音声認識性能を最適化しています。
大規模事前学習
VoxPopuliコーパスに基づき88.99999999999999時間の未ラベルデータ事前学習を実施。
16kHz音声サポート
モデルは16kHzサンプリングの音声データで事前学習されており、使用時には入力音声のサンプリングレートを一致させる必要があります。

モデル能力

音声認識
スラブ語系音声処理

使用事例

音声認識
スラブ語系音声テキスト変換
スラブ語系の音声をテキストに変換し、音声アシスタントや字幕生成などのシナリオに適用可能です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase