W

Wav2vec2 Large Xlsr Kinyarwanda Apostrophied

lucioによって開発
facebook/wav2vec2-large-xlsr-53をベースにルワンダ語で微調整したモデルで、代名詞と母音で始まる単語の省略形のアポストロフィの予測をサポートします。
ダウンロード数 28
リリース時間 : 3/2/2022

モデル概要

これはルワンダ語用の自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャに基づき、汎用音声データセットで微調整して訓練され、特にアポストロフィの認識能力が最適化されています。

モデル特徴

アポストロフィ認識の最適化
同類のモデルと比較して、このモデルは代名詞と母音で始まる単語の省略形のアポストロフィの認識能力を特別に最適化しています。
データ選別訓練
汎用音声データセットの中で反対票がなく、長さが9.5秒以下の高品質な音声フラグメントのみを使用して訓練します。
効率的な訓練
データ分塊戦略(32kサンプルブロック)により効率的な訓練を実現し、1つのV100 GPUで約60時間の訓練を完了します。

モデル能力

ルワンダ語音声認識
16kHzオーディオ処理
連続音声のテキスト変換

使用事例

音声文字起こし
ルワンダ語音声の文字起こし
ルワンダ語の音声内容をテキスト形式に変換します。
テスト単語誤り率39.92%
音声アシスタント
ルワンダ語音声指令の認識
ルワンダ語の音声アシスタントに音声認識能力を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase