W

Wav2vec2 Xls R 1b Italian Doc4lm 5gram

radiogroup-critsによって開発
XLS-R 10億パラメータモデルをファインチューニングしたイタリア語音声認識モデルで、言語モデル対応の認識をサポート
ダウンロード数 19
リリース時間 : 3/29/2022

モデル概要

これはイタリア語音声認識に最適化されたXLS-Rモデルで、複数のイタリア語データセットを使用してファインチューニングされており、言語モデル対応の高精度認識をサポートします

モデル特徴

大規模事前学習モデル
10億パラメータのXLS-Rモデルをベースにファインチューニングされており、強力な音声特徴抽出能力を有する
複数データセット学習
Common Voice 8.0、Multilingual TEDx、Multilingual LibriSpeech、Voxpopuliなどの複数のイタリア語データセットを使用して学習
言語モデルサポート
5-gram言語モデル対応バージョンを提供し、認識精度を大幅に向上
低誤り率
Common Voice 8.0テストセットで6.24%の単語誤り率(WER)と1.67%の文字誤り率(CER)を達成

モデル能力

イタリア語音声認識
高精度音声テキスト変換
16kHzサンプリングレート音声処理対応

使用事例

音声文字起こし
放送コンテンツ文字起こし
イタリア語放送番組を自動的にテキストに変換
高精度な文字起こし結果で、コンテンツアーカイブや分析に適している
音声アシスタント
イタリア語音声アシスタントに音声認識機能を提供
低遅延で高精度な音声コマンド認識
教育
言語学習アプリ
学習者のイタリア語発音とリスニング練習を支援
正確な発音評価とテキストフィードバック
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase