W

Wavlm Vindata Demo Dist

Developed by phongdtd
microsoft/wavlm-baseをベトナム語データセットでファインチューニングした自動音声認識モデル
Downloads 17
Release Time : 3/2/2022

Model Overview

このモデルはWavLMアーキテクチャに基づく自動音声認識(ASR)モデルで、ベトナム語音声認識タスクに特化してファインチューニングされています。

Model Features

ベトナム語音声認識最適化
ベトナム語データセットで特化してファインチューニングされ、ベトナム語の音声特性に最適化されています
WavLMアーキテクチャベース
マイクロソフトのWavLM-baseをベースモデルとして採用し、強力な音声表現能力を備えています
マルチGPUトレーニング
複数GPUを使用した分散トレーニングにより、トレーニング効率が向上しています

Model Capabilities

ベトナム語音声からテキストへの変換
連続音声認識
音声内容理解

Use Cases

音声文字起こし
ベトナム語会議議事録
ベトナム語の会議録音を自動的に文字記録に変換
音声アシスタント
ベトナム語音声アシスタントに音声認識機能を提供
メディア処理
動画字幕生成
ベトナム語の動画コンテンツに自動的に字幕を生成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase