W

Wav2vec2 Xls R 1b Italian

jonatasgrosmanによって開発
これはXLS-R 1Bアーキテクチャに基づくイタリア語自動音声認識モデルで、複数のイタリア語データセットでファインチューニングされています
ダウンロード数 2,703
リリース時間 : 3/2/2022

モデル概要

このモデルはイタリア語音声認識タスクに特化して最適化されており、イタリア語音声をテキストに変換できます

モデル特徴

高性能イタリア語認識
Common Voice 8.0テストセットで9.04%のWERと2.2%のCERを達成
言語モデル拡張対応
言語モデルと組み合わせると、WERは6.75%、CERは1.76%まで低下可能
複数データセットトレーニング
Common Voice 8.0、Multilingual TEDx、Multilingual LibriSpeech、Voxpopuliなど複数データセットでトレーニング
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に最適化

モデル能力

イタリア語音声認識
音声からテキストへの変換
言語モデル拡張対応

使用事例

音声文字起こし
イタリア語音声文字起こし
イタリア語音声コンテンツをテキストに変換
Common Voice 8.0テストセットで9.04%のWERを達成
音声アシスタント
イタリア語音声コマンド認識
イタリア語音声アシスタントシステムでの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase