W

Wav2vec2 Large Xlsr 53 Polish

jonatasgrosmanによって開発
ポーランド語に最適化されたXLSR-53大規模音声認識システム、facebook/wav2vec2-large-xlsr-53を基にファインチューニング、ポーランド語自動音声認識をサポート
ダウンロード数 412.13k
リリース時間 : 3/2/2022

モデル概要

これはXLSR-53アーキテクチャに基づくポーランド語音声認識モデルで、Common Voice 6.1ポーランド語データセットでファインチューニングされており、ポーランド語音声からテキストへの変換タスクに適しています。

モデル特徴

ポーランド語最適化
ポーランド語専用にファインチューニングされており、Common Voiceポーランド語テストセットで14.21%の単語誤り率を達成
言語モデル統合サポート
言語モデルと組み合わせることで認識精度をさらに向上可能、単語誤り率を10.98%まで低減
ロバスト音声処理
ロバスト音声イベントデータセットで良好な性能を発揮し、様々な環境下の音声入力を処理可能

モデル能力

ポーランド語音声認識
音声からテキストへの変換
16kHzサンプリングレート音声処理をサポート

使用事例

音声文字起こし
ポーランド語音声転写
ポーランド語音声コンテンツをテキストに変換
Common Voiceテストセットで単語誤り率14.21%、文字誤り率3.49%
音声アシスタント
ポーランド語音声コマンド認識
ポーランド語音声コマンドを認識・理解
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase