W

Wav2vec2 Large Xlsr 53 Latvian

anton-lによって開発
これはFacebookのWav2Vec2-Large-XLSR-53モデルをラトビア語Common Voiceデータセットでファインチューニングした自動音声認識(ASR)モデルです。
ダウンロード数 137
リリース時間 : 3/2/2022

モデル概要

このモデルはラトビア語の音声認識タスク専用に設計され、Common Voiceデータセットでファインチューニングされており、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

高精度ラトビア語認識
Common Voiceテストセットで26.89%のWER(単語誤り率)を達成
XLSR事前学習モデルベース
クロスリンガル音声表現学習(XLSR)事前学習モデルを活用したファインチューニング
言語モデル不要
追加の言語モデルサポートなしで直接使用可能

モデル能力

ラトビア語音声認識
16kHz音声処理
エンドツーエンド音声テキスト変換

使用事例

音声文字起こし
ラトビア語音声テキスト変換
ラトビア語音声コンテンツをテキストに変換
26.89% WER
音声アシスタント
ラトビア語音声コマンド認識
ラトビア語音声アシスタントや制御システム向け音声コマンド認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase