W

Wav2vec2 Large Xlsr 53 Vietnamese

Developed by anuragshas
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたベトナム語自動音声認識モデル、Common Voiceデータセットでトレーニング済み。
Downloads 279
Release Time : 3/2/2022

Model Overview

これはベトナム語向けの自動音声認識(ASR)モデルで、Wav2Vec2-Large-XLSR-53アーキテクチャをベースにファインチューニングされており、16kHzサンプリングレートの音声入力をサポートします。

Model Features

ベトナム語専用
ベトナム語に最適化された音声認識モデル
XLSR事前学習モデルベース
強力なwav2vec2-large-xlsr-53事前学習モデルを基盤に構築
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理可能

Model Capabilities

ベトナム語音声認識
音声テキスト変換
自動音声書き起こし

Use Cases

音声書き起こし
ベトナム語音声書き起こし
ベトナム語音声をテキストに変換
単語誤り率(WER)66.78%
音声アシスタント
ベトナム語音声コマンド認識
ベトナム語音声アシスタントやスマートホームデバイス向け
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase