W

Wav2vec2 Large Xlsr 53 Czech

MehdiHosseiniMoghadamによって開発
facebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングしたチェコ語自動音声認識(ASR)モデルで、Common Voiceチェコ語テストセットでWER27.05%を達成。
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

これはチェコ語自動音声認識用の事前学習モデルで、wav2vec2-large-xlsr-53アーキテクチャを基にファインチューニングされており、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

高精度チェコ語認識
Common Voiceチェコ語テストセットで27.05%のWERを達成
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に最適化

モデル能力

チェコ語音声認識
音声テキスト変換
自動音声転写

使用事例

音声転写
音声テキスト変換サービス
チェコ語音声コンテンツを自動的にテキストに変換
27.05% WERの認識精度
支援技術
音声制御アプリケーション
チェコ語ユーザー向け音声制御インターフェースを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase