W

Wav2vec2 Large Xlsr Vietnamese

CuongLDによって開発
これはfacebook/wav2vec2-large-xlsr - 53モデルをベトナム語で微調整した音声認識モデルで、Common VoiceとInfore_25hデータセットを使用して訓練されました。
ダウンロード数 37
リリース時間 : 3/2/2022

モデル概要

このモデルは専門的にベトナム語音声認識タスクに使用され、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

複数データセットによる訓練
Common VoiceとInfore_25hの2つのデータセットを使用して訓練され、モデルの汎化能力が向上しました。
16kHzサンプリングレートのサポート
専門的に16kHzサンプリングレートの音声入力認識を最適化してサポートします。
言語モデルが不要
直接使用でき、追加の言語モデルのサポートが不要です。

モデル能力

ベトナム語音声認識
自動音声からテキストへの変換

使用事例

音声書き起こし
ベトナム語音声の書き起こし
ベトナム語の音声内容をテキストに変換します
Common Voiceベトナム語テストセットでのWERは58.63%です
音声アシスタント
ベトナム語音声指令の認識
ベトナム語音声アシスタントの基本的な音声認識コンポーネントとして使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase