W

Wavlm Vindata Demo Dist

phongdtdによって開発
microsoft/wavlm-baseをベトナム語データセットでファインチューニングした自動音声認識モデル
ダウンロード数 17
リリース時間 : 3/2/2022

モデル概要

このモデルはWavLMアーキテクチャに基づく自動音声認識(ASR)モデルで、ベトナム語音声認識タスクに特化してファインチューニングされています。

モデル特徴

ベトナム語音声認識最適化
ベトナム語データセットで特化してファインチューニングされ、ベトナム語の音声特性に最適化されています
WavLMアーキテクチャベース
マイクロソフトのWavLM-baseをベースモデルとして採用し、強力な音声表現能力を備えています
マルチGPUトレーニング
複数GPUを使用した分散トレーニングにより、トレーニング効率が向上しています

モデル能力

ベトナム語音声からテキストへの変換
連続音声認識
音声内容理解

使用事例

音声文字起こし
ベトナム語会議議事録
ベトナム語の会議録音を自動的に文字記録に変換
音声アシスタント
ベトナム語音声アシスタントに音声認識機能を提供
メディア処理
動画字幕生成
ベトナム語の動画コンテンツに自動的に字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase