X

Xls R Uzbek Cv8

lucioによって開発
facebook/wav2vec2-xls-r-300mをベースに、ウズベク語Common Voice 8データセットで微調整した自動音声認識モデル
ダウンロード数 2,860
リリース時間 : 3/2/2022

モデル概要

このモデルはウズベク語用の自動音声認識システムで、Common Voice 8データセットで訓練され、低精度の音声文字変換シーンに適しています

モデル特徴

ウズベク語専用モデル
ウズベク語に特化して最適化された音声認識モデル
低リソース最適化
Common Voiceデータセットの50%の訓練データを使用して良好な結果を達成
言語モデル強化
kenlm言語モデルを組み合わせることで、認識精度を大幅に向上させる
特殊文字処理
ウズベク語の特殊文字<‘>と<’>を正しく処理する

モデル能力

ウズベク語音声認識
低精度音声文字変換
放送録音インデックス

使用事例

メディア処理
動画字幕生成
ウズベク語動画に対して初期字幕草稿を生成する
放送録音インデックス
ウズベク語の放送内容を自動的にインデックス付けする
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase