W

Wav2vec2 Large Xlsr 53 Vietnamese

anuragshasによって開発
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたベトナム語自動音声認識モデル、Common Voiceデータセットでトレーニング済み。
ダウンロード数 279
リリース時間 : 3/2/2022

モデル概要

これはベトナム語向けの自動音声認識(ASR)モデルで、Wav2Vec2-Large-XLSR-53アーキテクチャをベースにファインチューニングされており、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

ベトナム語専用
ベトナム語に最適化された音声認識モデル
XLSR事前学習モデルベース
強力なwav2vec2-large-xlsr-53事前学習モデルを基盤に構築
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理可能

モデル能力

ベトナム語音声認識
音声テキスト変換
自動音声書き起こし

使用事例

音声書き起こし
ベトナム語音声書き起こし
ベトナム語音声をテキストに変換
単語誤り率(WER)66.78%
音声アシスタント
ベトナム語音声コマンド認識
ベトナム語音声アシスタントやスマートホームデバイス向け
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase