M

Mhubert Base 25hz

由slprl開發
Meta公司Hubert模型的一個版本,在TWIST論文中提出,作為訓練SpeechLMs的語音標記器展現出重要價值。
下載量 10.63k
發布時間 : 10/24/2024

模型概述

該Hubert模型用於語音特徵提取,適用於口語語言建模或說話風格轉換等場景。

模型特點

25Hz特徵率
在CNN編碼器添加了步長為2的卷積層,最終生成25Hz特徵。
多語言支持
模型訓練使用了多種多語言數據集組合。
語音標記器
在訓練SpeechLMs時展現出重要價值。

模型能力

語音特徵提取
口語語言建模
說話風格轉換

使用案例

語音處理
口語語言建模
用於構建口語語言模型
說話風格轉換
用於實現說話人風格轉換
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase