W

Wav2vec2 Xlsr Chuvash

gagan3012によって開発
facebook/wav2vec2-large-xlsr-53を基にチュヴァシ語でファインチューニングしたモデルで、自動音声認識タスクに使用されます。
ダウンロード数 54
リリース時間 : 3/2/2022

モデル概要

このモデルはFacebookのwav2vec2-large-xlsr-53モデルをチュヴァシ語でファインチューニングした自動音声認識(ASR)モデルで、Common Voiceデータセットで訓練され、チュヴァシ語の音声からテキストへの変換機能をサポートします。

モデル特徴

チュヴァシ語サポート
チュヴァシ語に特化して最適化された音声認識モデル
XLSR-53アーキテクチャベース
大規模な多言語音声表現学習事前訓練モデルを活用
言語モデル不要
追加の言語モデルサポートなしで直接使用可能

モデル能力

チュヴァシ語音声認識
音声からテキストへの変換
16kHz音声処理

使用事例

音声文字起こし
チュヴァシ語音声転写
チュヴァシ語の音声内容をテキストに変換
Common VoiceテストセットでWER48.40%
音声アシスタントアプリケーション
チュヴァシ語音声アシスタント
チュヴァシ語音声制御アプリケーションの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase