S

Speechless Llama3.2 V0.1

由homebrewltd開發
Speechless是一款緊湊的開源文本轉語義模型(10億參數),旨在直接將音頻轉換為離散的語義表徵標記,無需依賴傳統的文本轉語音(TTS)模型。
下載量 28
發布時間 : 12/28/2024

模型概述

該模型通過直接將文本轉換為語義語音標記,簡化了訓練流程,節省了資源,並實現了可擴展性,尤其適用於資源匱乏的語言。

模型特點

直接音頻轉換
無需依賴傳統的文本轉語音(TTS)模型,直接將音頻轉換為離散的語義表徵標記。
資源高效
簡化了訓練流程,節省了資源,尤其適用於資源匱乏的語言。
多語言支持
支持英文和越南文,基於超過400小時的英文和1000小時的越南語數據訓練。

模型能力

音頻轉語義標記
多語言處理
高效資源利用

使用案例

語音處理
語音標記生成
將音頻直接轉換為離散的語義表徵標記,用於後續處理或分析。
詞錯誤率在越南文測試集上為3.99,在英文測試集上為3.27。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase