A

Asr Hubert Cluster Bart Base

由voidful開發
基於Hubert和BART架構的自動語音識別模型,通過聚類特徵轉換實現語音到文本的轉換
下載量 13
發布時間 : 3/2/2022

模型概述

該模型結合了Hubert的語音特徵提取能力和BART的序列到序列轉換能力,專門用於自動語音識別(ASR)任務。

模型特點

Hubert特徵聚類
使用Hubert提取語音特徵並通過k-means聚類進行編碼
BART序列轉換
利用BART模型將聚類特徵序列轉換為文本序列
高效語音處理
能夠處理各種採樣率的語音輸入並轉換為文本

模型能力

英語語音識別
語音特徵提取
序列到文本轉換

使用案例

語音轉錄
演講轉錄
將演講錄音轉換為文字記錄
示例結果:'沿著泥濘的鄉間小路行進,連續兩週在潮溼的校舍裡對著溼漉漉的聽眾演講...'
語音助手
語音指令識別
識別並轉換用戶的語音指令為可執行命令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase