W

Wav2vec2 Xlsr Basaa

sammy786によって開発
このモデルはfacebook/wav2vec2-xls-r-1bをCommon Voice 8バサ語データセットでファインチューニングした自動音声認識モデルです。
ダウンロード数 20
リリース時間 : 3/2/2022

モデル概要

これはバサ語の自動音声認識用モデルで、wav2vec2-xls-r-1bアーキテクチャを基にCommon Voice 8データセットでトレーニングされました。

モデル特徴

高性能バサ語認識
Common Voice 8バサ語データセットでファインチューニングされ、単語誤り率(WER)41.23、文字誤り率(CER)13.54
大規模事前学習モデルベース
facebook/wav2vec2-xls-r-1bモデルを基にファインチューニングされており、強力な音声特徴抽出能力を継承
ロバストな音声処理
対話シーンや異なる音声品質の入力を処理可能

モデル能力

バサ語音声認識
自動音声テキスト変換
対話音声処理

使用事例

音声書き起こし
バサ語音声転写
バサ語音声コンテンツをテキストに変換
単語誤り率41.23%、文字誤り率13.54%
音声アシスタント
バサ語音声インタラクション
バサ語音声アシスタントや対話システムの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase