W

Wavlm VLSP Vi

phongdtdによって開発
microsoft/wavlm-base-plusをベースに、PHONGDTD/VINDATAVLSP - NAデータセットで微調整したベトナム語自動音声認識モデル
ダウンロード数 21
リリース時間 : 3/2/2022

モデル概要

このモデルは、ベトナム語の自動音声認識(ASR)タスクに最適化されたモデルで、WavLMアーキテクチャを基に微調整されています。

モデル特徴

ベトナム語最適化
ベトナム語音声認識タスクに特化して微調整されています。
WavLMアーキテクチャベース
マイクロソフトのWavLM-base-plusをベースモデルとして使用し、強力な音声表現能力を持っています。
マルチGPU訓練
分散型マルチGPU訓練方式を採用し、訓練効率を向上させています。

モデル能力

ベトナム語音声をテキストに変換
連続音声認識

使用事例

音声文字起こし
ベトナム語会議記録
ベトナム語の会議録音を文字記録に変換します。
音声アシスタント
ベトナム語音声アシスタントに音声認識機能を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase