W

Wav2vec2 Large Xlsr Upper Sorbian Mixed

jimreganによって開発
これはfacebook/wav2vec2-large-xlsr-53をファインチューニングした上ソルブ語音声認識モデルで、トレーニングデータはCommon Voiceデータセットとオンラインソルブ語コースから取得されています。
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

このモデルは上ソルブ語の自動音声認識タスクに使用され、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

マルチソースデータトレーニング
Common Voiceデータセットとオンラインソルブ語コースデータを組み合わせ、モデル性能を強化
高い互換性
16kHzサンプリングレートの音声入力をサポートし、様々な音声認識シナリオに適用可能
事前学習ファインチューニング
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングし、強力な音声特徴抽出能力を継承

モデル能力

上ソルブ語音声認識
自動音声テキスト変換

使用事例

教育
ソルブ語学習支援
学習者が音声認識を通じて発音の正確性を確認するのを支援
音声文字起こし
上ソルブ語音声転写
上ソルブ語の音声コンテンツをテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase