W

Wav2vec2 Large Xlsr 53 Lithuanian

anton-lによって開発
facebook/wav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットを使用してリトアニア語にファインチューニングした自動音声認識モデルです。
ダウンロード数 29
リリース時間 : 3/2/2022

モデル概要

これはリトアニア語向けの自動音声認識(ASR)モデルで、リトアニア語の音声をテキストに変換できます。

モデル特徴

リトアニア語最適化
リトアニア語に特化してファインチューニングされており、この言語の認識精度を向上させています
XLSR-53アーキテクチャ採用
大規模多言語事前学習モデルを基盤としており、強力な音声特徴抽出能力を備えています
16kHzサンプリングレート対応
標準的な16kHzサンプリングレートの音声入力をサポートし、ほとんどの音声アプリケーションシナリオに適しています

モデル能力

リトアニア語音声認識
音声からテキストへの変換
自動音声転写

使用事例

音声転写
リトアニア語音声からテキストへ
リトアニア語の音声コンテンツを編集可能なテキスト形式に変換します
Common VoiceテストセットでWERが49.00%
音声アシスタント
リトアニア語音声コマンド認識
リトアニア語をサポートする音声アシスタントや制御システムの開発に使用できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase