W

Wav2vec2 Large Xlrs Estonian

birgermoellによって開発
これは、facebook/wav2vec2-large-xlsr-53モデルをベースに、エストニア語の汎用音声データセットで微調整された自動音声認識(ASR)モデルです。
ダウンロード数 18
リリース時間 : 3/2/2022

モデル概要

このモデルは、エストニア語の音声認識タスクに特化しており、Wav2Vec2アーキテクチャに基づき、汎用音声データセットで微調整されています。

モデル特徴

XLSR微調整
大規模多言語事前学習モデルXLSR-53をベースに、エストニア語で微調整
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を専門に処理
言語モデル不要
追加の言語モデルなしで直接使用可能

モデル能力

エストニア語音声認識
オーディオをテキストに変換

使用事例

音声文字起こし
エストニア語音声をテキストに変換
エストニア語の音声をテキスト内容に変換
WER 36.95%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase