W

Wav2vec2 Xls R 1b Italian Robust

dbdmgによって開発
facebook/wav2vec2 - xls - r - 1bをCommon Voice 7とLibri Speechデータセットでファインチューニングしたイタリア語自動音声認識モデル
ダウンロード数 130
リリース時間 : 3/2/2022

モデル概要

これはイタリア語に最適化された自動音声認識(ASR)モデルで、XLS - Rアーキテクチャに基づき、Common Voice 7とLibri Speechデータセットでファインチューニングされています。

モデル特徴

高性能イタリア語認識
Common Voice 7イタリア語テストセットで19.55%のWER(言語モデル使用時)を達成
大規模事前学習
10億パラメータのXLS - Rアーキテクチャに基づき、強力な音声特徴抽出能力を持つ
言語モデル強化
言語モデルの統合をサポートし、認識精度を大幅に向上させる

モデル能力

イタリア語音声認識
音声からテキストへの変換
長い音声ファイルの処理

使用事例

音声文字起こし
イタリア語音声からテキストへの変換
イタリア語の音声内容をテキスト形式に変換
Common Voice 7テストセットで19.55%の単語誤り率を達成
音声アシスタント
イタリア語音声指令認識
イタリア語の音声アシスタントまたはスマートホームシステムの音声指令認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase