W

Wav2vec2 Large Xlsr Italian

joaoalvarengaによって開発
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたイタリア語音声認識モデル、ユニバーサル音声イタリア語テストセットで単語誤り率13.91%
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

これはイタリア語に最適化された自動音声認識(ASR)モデルで、Facebookのwav2vec2-large-xlsr-53アーキテクチャを基に、ユニバーサル音声データセットのイタリア語部分でファインチューニングされています。

モデル特徴

高精度イタリア語認識
ユニバーサル音声イタリア語テストセットで13.91%の単語誤り率を達成
XLSRアーキテクチャ採用
クロスリンガル音声表現学習(XLSR)の強力な能力を活用
言語モデル不要
追加の言語モデルサポートなしで直接使用可能

モデル能力

イタリア語音声からテキストへ変換
オーディオコンテンツの文字起こし
音声コマンド認識

使用事例

音声文字起こし
会議議録の自動化
イタリア語の会議録音を自動的に文字記録に変換
約86%の正確率
音声アシスタント開発
イタリア語対応の音声対話アプリケーション構築
教育技術
言語学習アプリケーション
学習者のイタリア語発音とリスニング練習を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase