W

Wav2vec2 Large Xlsr 53 French Punctuation

Ilyesによって開発
wav2vec2-large-xlsr-53アーキテクチャに基づくフランス語自動音声認識モデルで、句読点予測をサポート
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルはフランス語音声認識専用に設計されたwav2vec2-large-xlsr-53のファインチューン版で、句読点を含む音声転記タスクを処理可能

モデル特徴

句読点予測
自動的に句読点を予測・追加し、転記テキストの可読性を向上
高精度
Common Voiceフランス語テストセットでWER 19.47%、CER 6.66%の優れた性能を達成
XLSRファインチューニング
多言語音声表現(XLSR)事前学習モデルに基づくファインチューニングで、強力な音声特徴抽出能力を有する

モデル能力

フランス語音声認識
自動句読点予測
音声テキスト変換

使用事例

音声転記
会議議事録
フランス語会議録音を自動転記し句読点を追加
転記効率とテキスト可読性の向上
メディア字幕生成
フランス語動画コンテンツ向けに句読点付き字幕を生成
手作業字幕作成時間の削減
音声アシスタント
フランス語音声入力
フランス語音声コマンドの認識・処理をサポート
音声インタラクション体験の向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase