W

Wav2vec2 Large Xlsr 53 Estonian

vasilisによって開発
facebook/wav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットでエストニア語にファインチューニングした自動音声認識モデル
ダウンロード数 26
リリース時間 : 3/2/2022

モデル概要

これはエストニア語に最適化された自動音声認識(ASR)モデルで、XLSR-53アーキテクチャに基づき、エストニア語の音声をテキストに変換するために設計されています。

モデル特徴

エストニア語最適化
エストニア語に特化してファインチューニングされており、この言語の認識精度が向上しています
言語モデル不要
追加の言語モデルなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に最適化されています

モデル能力

エストニア語音声からテキストへの変換
音声認識
音声文字起こし

使用事例

音声文字起こし
エストニア語音声の文字起こし
エストニア語の音声コンテンツをテキストに変換
テストWER 30.658320%、CER 5.261490%
音声アシスタント
エストニア語音声コマンド認識
エストニア語音声アシスタントやスマートデバイスのコマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase