W

Wav2vec2 Large Xls R 300m Sr V4

DrishtiSharmaによって開発
facebook/wav2vec2-xls-r-300mをベースに、セルビア語(sr)データセットで微調整した自動音声認識モデル
ダウンロード数 28
リリース時間 : 3/2/2022

モデル概要

このモデルは、セルビア語の自動音声認識(ASR)タスクに最適化されたwav2vec2モデルで、Common Voice 8データセットで微調整され、セルビア語の音声をテキストに変換するタスクをサポートします。

モデル特徴

セルビア語最適化
セルビア語に特化して微調整され、Common Voice 8データセットで良好な性能を発揮します。
大規模モデルベース
facebookのwav2vec2-xls-r-300mという大規模モデルアーキテクチャをベースに構築され、強力な音声特徴抽出能力を備えています。
多シーン評価
Common Voiceやロバスト音声コンテストなどの複数のデータセットで評価されています。

モデル能力

セルビア語音声認識
音声をテキストに変換
長い音声ファイルの処理(ブロック分割処理をサポート)

使用事例

音声文字起こし
セルビア語音声文字起こし
セルビア語の音声をテキストに変換する
Common Voice 8テストセットでのWERは30.33%です。
音声認識システム
音声アシスタント
セルビア語の音声アシスタント開発に使用する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase