W

Wav2vec2 Base Fr Voxpopuli V2

facebookによって開発
FacebookのWav2Vec2ベースモデルで、フランス語のみで事前学習され、VoxPopuliコーパスの22.8kの無ラベルデータを使用しています。
ダウンロード数 103
リリース時間 : 3/2/2022

モデル概要

このモデルはWav2Vec2アーキテクチャに基づく音声処理モデルで、フランス語音声に特化して事前学習され、音声認識タスクに適しています。

モデル特徴

フランス語専用事前学習
モデルはフランス語音声に特化して事前学習され、フランス語音声認識の性能を最適化しています。
VoxPopuliコーパスに基づく
VoxPopuliコーパスの22.8kの無ラベルデータを使用して事前学習され、データのソースは信頼性が高く多様です。
16kHzサンプリングレート対応
モデルは16kHzサンプリングの音声オーディオで事前学習されており、使用時には入力オーディオも同じく16kHzでサンプリングされている必要があります。

モデル能力

フランス語音声認識
音声特徴抽出

使用事例

音声認識
フランス語音声をテキストに変換
フランス語音声をテキストに変換し、音声アシスタントや字幕生成などのシーンに適しています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase