W

Wav2vec NCKH 2022

由hoangbinhmta99開發
基於Wav2vec2架構的越南語自動語音識別模型,支持從音頻到文本的轉換
下載量 29
發布時間 : 3/30/2022

模型概述

該模型是一個基於Transformer架構的自動語音識別(ASR)模型,專門針對越南語語音識別任務進行優化。它能夠將越南語語音轉換為對應的文本內容。

模型特點

越南語語音識別
專門針對越南語優化的語音識別能力
基於Transformer架構
採用先進的Transformer架構,提供高質量的語音識別性能
預訓練模型轉換
支持從.pt格式的預訓練模型轉換為Transformer格式

模型能力

越南語語音識別
音頻轉文本
自動語音識別

使用案例

語音轉寫
越南語語音轉文本
將越南語語音內容轉換為可編輯的文本格式
語音助手
越南語語音指令識別
用於構建支持越南語的語音助手系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase