W

Wav2vec2 Large Xlsr 53 Basque

stefan-itによって開発
facebook/wav2vec2-large-xlsr-53モデルを基に、汎用音声データベースのバスク語データでファインチューニングした自動音声認識モデル
ダウンロード数 10.70k
リリース時間 : 3/2/2022

モデル概要

これはバスク語に最適化された自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャに基づいており、バスク語音声をテキストに変換するのに適しています。

モデル特徴

高精度バスク語認識
汎用音声データベースのバスク語テストセットで18.27%のWER(単語誤り率)を達成
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に最適化

モデル能力

バスク語音声認識
音声からテキストへの変換
自動音声転写

使用事例

音声転写
バスク語音声転写
バスク語音声コンテンツをテキストに変換
18.27%の単語誤り率
音声アシスタント
バスク語音声コマンド認識
バスク語音声アシスタントや音声制御システムの音声認識コンポーネントとして使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase