xls-r-300m-it-phonemeオープンソース音声認識モデル - 無料でデプロイしてイタリア語音声を高精度に認識

Xls R 300m It Phoneme

patrickvonplatenによって開発

facebook/wav2vec2-xls-r-300mをイタリア語データセットでファインチューニングした音声認識モデル

ダウンロード数 17

リリース時間 : 3/2/2022

モデル概要

このモデルはfacebook/wav2vec2-xls-r-300mをmozilla-foundation/common_voice_3_0 - ITデータセットでファインチューニングしたバージョンで、主にイタリア語音声認識タスクに使用されます。

イタリア語音声認識

イタリア語に特化して最適化された音声認識能力

XLS-Rアーキテクチャベース

facebookのwav2vec2-xls-r-300mをベースモデルとして使用

低単語誤り率

評価データセットで7.7%の単語誤り率を達成

イタリア語音声からテキストへの変換

連続音声認識

音声書き起こし

イタリア語音声転写

イタリア語音声コンテンツをテキストに変換

単語誤り率7.7%

音声アシスタント

イタリア語音声コマンド認識

イタリア語音声アシスタントシステムでのコマンド認識に使用