W

Wav2vec2 Large Xlsr Polish

mbienによって開発
facebook/wav2vec2-large-xlsr-53をCommon Voiceポーランド語データセットでファインチューニングした音声認識モデル、テストセットの単語誤り率23.01%
ダウンロード数 40
リリース時間 : 3/2/2022

モデル概要

これはポーランド語に最適化された自動音声認識(ASR)モデルで、ポーランド語音声をテキストに変換できます。

モデル特徴

高精度ポーランド語認識
Common Voiceポーランド語テストセットで23.01%の単語誤り率を達成
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
XLSRアーキテクチャベース
facebookのwav2vec2-large-xlsr-53をベースモデルとして使用し、強力な音声特徴抽出能力を有する

モデル能力

ポーランド語音声認識
音声からテキストへの変換
16kHz音声処理

使用事例

音声書き起こし
ポーランド語音声転写
ポーランド語音声コンテンツを編集可能なテキスト形式に変換
単語誤り率23.01%
音声アシスタント
ポーランド語音声コマンド認識
ポーランド語音声アシスタントや音声制御システムの構築に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase