A

Asr Hubert Cluster Bart Base

Developed by voidful
基於Hubert和BART架構的自動語音識別模型,通過聚類特徵轉換實現語音到文本的轉換
Downloads 13
Release Time : 3/2/2022

Model Overview

該模型結合了Hubert的語音特徵提取能力和BART的序列到序列轉換能力,專門用於自動語音識別(ASR)任務。

Model Features

Hubert特徵聚類
使用Hubert提取語音特徵並通過k-means聚類進行編碼
BART序列轉換
利用BART模型將聚類特徵序列轉換為文本序列
高效語音處理
能夠處理各種採樣率的語音輸入並轉換為文本

Model Capabilities

英語語音識別
語音特徵提取
序列到文本轉換

Use Cases

語音轉錄
演講轉錄
將演講錄音轉換為文字記錄
示例結果:'沿著泥濘的鄉間小路行進,連續兩週在潮溼的校舍裡對著溼漉漉的聽眾演講...'
語音助手
語音指令識別
識別並轉換用戶的語音指令為可執行命令
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase