W

Wav2vec2 Large Xls R 300m Bas V1

DrishtiSharmaによって開発
これはfacebook/wav2vec2-xls-r-300mモデルを基に、バサ語(MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - BASデータセット)でファインチューニングした自動音声認識モデルです。
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルはバサ語の自動音声認識タスクに特化しており、Common Voice 8テストセットで35.66%の単語誤り率(WER)と11.03%の文字誤り率(CER)を達成しました。

モデル特徴

バサ語音声認識
バサ語に最適化された音声認識能力
XLS-Rアーキテクチャ採用
facebookのwav2vec2-xls-r-300m事前学習モデルを基盤として使用
Common Voiceデータセットでファインチューニング
MOZILLA-FOUNDATION/COMMON_VOICE_8_0のバサ語データを使用してファインチューニング

モデル能力

バサ語音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
バサ語音声文字起こし
バサ語音声をテキストに変換
テストセットでWER35.66%、CER11.03%を達成
音声アシスタント
バサ語音声アシスタント
バサ語インタラクションをサポートする音声アシスタントアプリケーション
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase