W

Wav2vec2 Large Xlsr 53 Eu

enterprise-explorersによって開発
facebook/wav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットでバスク語にファインチューニングした音声認識モデルです。
ダウンロード数 2,758
リリース時間 : 3/2/2022

モデル概要

これはバスク語に最適化された自動音声認識(ASR)モデルで、FacebookのWav2Vec2-Large-XLSR-53アーキテクチャを基に、Common Voiceのバスク語データセットでファインチューニングされています。

モデル特徴

バスク語最適化
バスク語に特化してファインチューニングされており、より高い音声認識精度を提供します
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力処理に最適化されています

モデル能力

バスク語音声認識
音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
バスク語音声転写
バスク語の音声コンテンツをテキストに変換
Common Voiceテストセットで15.34%のWERを達成
音声アシスタント
バスク語音声コマンド認識
バスク語音声アシスタントや制御システムの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase