W

Wav2vec2 Large Xlsr Lithuanian

m3hrdadfiによって開発
これはFacebookのwav2vec2-large-xlsr-53モデルを微調整したリトアニア語の自動音声認識(ASR)モデルで、Common Voiceデータセットを使用してトレーニングされています。
ダウンロード数 570
リリース時間 : 3/2/2022

モデル概要

このモデルはリトアニア語の自動音声認識タスクに特化しており、リトアニア語の音声をテキストに変換することができます。

モデル特徴

高精度なリトアニア語認識
リトアニア語に特化して最適化された音声認識モデルで、Common Voiceテストセットで34.66%のWERを達成しています。
XLSRアーキテクチャに基づく
Facebookのwav2vec2-large-xlsr-53をベースモデルとして使用し、強力な多言語表現能力を持っています。
言語モデル不要
直接使用でき、追加の言語モデルのサポートを必要としません。

モデル能力

リトアニア語音声認識
16kHzオーディオ処理
エンドツーエンドの音声からテキストへの変換

使用事例

音声文字起こし
音声内容の文字起こし
リトアニア語の音声内容を自動的にテキストに変換します。
Common VoiceテストセットでのWERは34.66%です。
音声アシスタント
リトアニア語音声コマンド認識
リトアニア語の音声アシスタントのフロントエンド音声認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase