W

Wav2vec2 Large Xls R 300m Assamese

infinitejoyによって開発
このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voice_7_0データセットでファインチューニングしたバージョンで、アッサム語の自動音声認識タスクに使用されます。
ダウンロード数 13
リリース時間 : 3/2/2022

モデル概要

これはアッサム語に最適化された自動音声認識モデルで、XLS-R-300Mアーキテクチャを基にファインチューニングされており、アッサム語の音声から文字への変換タスクに適しています。

モデル特徴

アッサム語最適化
アッサム語に特化してファインチューニングされており、この言語の認識精度が向上しています
XLS-R-300Mベース
強力なXLS-R-300Mアーキテクチャをベースモデルとして使用
Common Voiceデータセットでトレーニング
mozilla-foundation/common_voice_7_0データセットでトレーニングされています

モデル能力

アッサム語音声認識
音声から文字への変換

使用事例

音声文字起こし
アッサム語音声から文字へ
アッサム語の音声コンテンツを文字に変換
WER: 72.64, CER: 27.35
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase