W

Wav2vec2 Large Xlsr As

anuragshasによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルを基にアッサム語でファインチューニングした自動音声認識モデルで、Common Voiceデータセットを使用してトレーニングされています。
ダウンロード数 30
リリース時間 : 3/2/2022

モデル概要

このモデルはアッサム語の自動音声認識タスクに使用され、アッサム語の音声をテキストに変換できます。

モデル特徴

多言語サポート
XLSR-53モデルを基にしており、言語横断的な音声認識能力を備えています
高い適応性
アッサム語に特化してファインチューニングされており、この言語の音声認識に適しています
オープンソースライセンス
Apache 2.0ライセンスを使用しており、商業利用や研究利用が許可されています

モデル能力

アッサム語音声認識
16kHzオーディオ処理

使用事例

音声からテキストへ
アッサム語音声文字起こし
アッサム語の音声コンテンツをテキストに変換
Common VoiceテストセットでWERが69.63%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase