W

Wav2vec2 Xls R 300m Uk

robinhadによって開発
これはfacebook/wav2vec2-xls-r-300mモデルをウクライナ語データセットでファインチューニングした自動音声認識(ASR)モデルで、Common Voiceウクライナ語テストセットで12.22%の単語誤り率(WER)を達成しました。
ダウンロード数 72
リリース時間 : 3/2/2022

モデル概要

このモデルはウクライナ語の自動音声認識タスク専用に設計されており、ウクライナ語の音声をテキストに変換できます。

モデル特徴

低い単語誤り率
Common Voiceウクライナ語テストセットでわずか12.22%の単語誤り率(WER)を達成し、優れた性能を発揮
XLS-Rアーキテクチャ採用
facebookのwav2vec2-xls-r-300mアーキテクチャを採用し、強力な音声特徴抽出能力を備えています
ウクライナ語最適化
ウクライナ語に特化してファインチューニングされており、ウクライナ語音声認識に最適

モデル能力

ウクライナ語音声認識
音声からテキストへの変換

使用事例

音声書き起こし
ウクライナ語音声から文字へ
ウクライナ語の音声コンテンツを編集可能なテキストに変換
87.78%の精度(WER=12.22%)
音声アシスタント
ウクライナ語音声アシスタント
ウクライナ語ユーザー向けの音声インタラクション機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase