A

Asr Crdnn Commonvoice Fr

speechbrainによって開発
これはCommonVoiceフランス語データセットでトレーニングされたエンドツーエンド自動音声認識システムで、CRDNNアーキテクチャとCTCおよびアテンションメカニズムを組み合わせています。
ダウンロード数 167
リリース時間 : 3/2/2022

モデル概要

このモデルはフランス語音声認識タスクに使用され、フランス語音声をテキストに変換でき、フランス語音声書き起こしが必要なアプリケーションシナリオに適しています。

モデル特徴

デュアルデコードメカニズム
CTCとアテンションメカニズムを同時に使用してデコードし、認識精度を向上させる
サブワード単位トークン化
unigramトークナイザーを使用して単語をサブワード単位に変換し、未知の語彙に対するモデルの処理能力を向上させる
自動音声処理
自動リサンプリングやモノラル選択を含む組み込みの音声正規化処理

モデル能力

フランス語音声認識
音声書き起こし
音声からテキストへの変換

使用事例

音声書き起こし
フランス語音声書き起こし
フランス語音声コンテンツをテキスト形式に変換する
テストセットCER 6.54%、WER 17.70%
音声アシスタント
フランス語音声コマンド認識
フランス語音声アシスタントやスマートホームデバイスの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase