W

Wav2vec2 Large Xlsr 53 Ukrainian

anton-lによって開発
facebook/wav2vec2-large-xlsr-53モデルを基に微調整されたウクライナ語自動音声認識(ASR)モデルで、Common Voiceデータセットを使用して訓練されています。
ダウンロード数 21
リリース時間 : 3/2/2022

モデル概要

これはウクライナ語に最適化された自動音声認識モデルで、ウクライナ語の音声をテキストに変換することができます。

モデル特徴

高精度ウクライナ語認識
ウクライナ語に最適化された音声認識モデルで、Common Voiceテストセットで32.29%の単語誤り率(WER)を達成しています。
XLSR事前学習モデルに基づく
facebook/wav2vec2-large-xlsr-53モデルを基に微調整され、言語間音声表現学習技術を利用しています。
言語モデル不要
直接使用でき、追加の言語モデルのサポートは必要ありません。

モデル能力

ウクライナ語音声認識
オーディオをテキストに変換
16kHzオーディオ処理

使用事例

音声文字起こし
ウクライナ語音声を文字に変換
ウクライナ語の音声内容を編集可能なテキストに変換します。
32.29%単語誤り率
音声アシスタント
ウクライナ語音声コマンド認識
ウクライナ語音声アシスタントを構築するための基礎認識コンポーネントとして使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase