W

Wav2vec2 Xls R 300m Cs 250

comodoroによって開発
これはfacebook/wav2vec2-xls-r-300mをチェコ語データセットでファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 248.66k
リリース時間 : 3/2/2022

モデル概要

このモデルはチェコ語向けの自動音声認識モデルで、Common Voice 8.0などのデータセットでファインチューニングされており、直接使用可能または言語モデルと組み合わせて使用できます。

モデル特徴

複数データセット訓練
Common Voice 8.0、OVM、PSCR、Vystadial2016など複数のチェコ語データセットを使用して訓練
高性能
Common Voice 8.0テストセットで7.3%の単語誤り率と2.1%の文字誤り率を達成
直接使用
言語モデル不要で直接音声認識可能

モデル能力

チェコ語音声認識
16kHzサンプリングレート音声処理
言語モデル不要の直接推論

使用事例

音声文字起こし
音声からテキストへ
チェコ語音声内容をテキストに変換
単語誤り率7.3%、文字誤り率2.1%
音声分析
音声内容分析
チェコ語音声内容を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase