W

Wav2vec2 Large Xlsr 53 Italian

jonatasgrosmanによって開発
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたイタリア語自動音声認識モデルで、Common Voice 6.1データセットで訓練されました。
ダウンロード数 1,012
リリース時間 : 3/2/2022

モデル概要

このモデルはイタリア語に最適化された自動音声認識(ASR)モデルで、XLSR - 53アーキテクチャをベースに微調整され、16kHzサンプリングレートの音声入力変換をサポートします。

モデル特徴

高性能イタリア語認識
Common Voiceイタリア語テストセットで9.41%の単語誤り率(WER)と2.29%の文字誤り率(CER)を達成しました。
言語モデル強化
言語モデルを組み合わせると、単語誤り率をさらに6.91%に、文字誤り率を1.83%に下げることができます。
多シーン適用可能
標準テストセットとロバスト音声コンテスト開発セットで良好な性能を示し、強い汎化能力を示しています。
簡単な統合
HuggingSoundライブラリとカスタムスクリプトの2つの使用方法を提供し、アプリケーションへの迅速な統合を容易にします。

モデル能力

イタリア語音声をテキストに変換
16kHzオーディオ処理
バッチ音声認識
長いオーディオのブロック処理

使用事例

音声文字起こし
イタリア語音声内容の文字起こし
イタリア語音声内容をテキスト形式に変換します。
高い精度の文字起こし結果で、コンテンツのアーカイブと分析に適しています。
音声アシスタント
イタリア語音声指令認識
イタリア語音声アシスタントシステムの指令認識に使用されます。
低遅延で高い精度の指令認識
バリアフリーアプリケーション
音声を文字に変換する支援
聴覚障害者にリアルタイムの音声を文字に変換するサービスを提供します。
高い精度のリアルタイム変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase