F

Fb Vindata Vi Large

phongdtdによって開発
このモデルは、facebook/wav2vec2-large-xlsr-53をPHONGDTD/VINDATAVLSP - NAデータセットでファインチューニングしたベトナム語自動音声認識モデルです
ダウンロード数 29
リリース時間 : 3/2/2022

モデル概要

ベトナム語に最適化された自動音声認識モデルで、wav2vec2-large-xlsr-53アーキテクチャを基にファインチューニングされています

モデル特徴

ベトナム語最適化
ベトナム語音声認識タスクに特化してファインチューニングされています
wav2vec2アーキテクチャ採用
facebookのwav2vec2-large-xlsr-53をベースモデルとして使用しています
マルチGPUトレーニング
2つのGPUを使用した分散トレーニングを実施しています

モデル能力

ベトナム語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
ベトナム語音声文字起こし
ベトナム語の音声内容をテキストに変換します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase