M

Mms Zeroshot 300m

由mms-meta開發
基於MMS零樣本項目的檢查點模型,能夠轉錄幾乎所有語言的語音,僅需少量目標語言的未標註文本。
下載量 48
發布時間 : 7/30/2024

模型概述

該模型是一個多語言語音識別系統,通過少量目標語言的文本映射到中間表示,結合可選語言模型實現對新語言的轉錄。

模型特點

零樣本語音識別
僅需少量目標語言的未標註文本即可轉錄新語言的語音。
多語言支持
支持1,150種語言的語音識別,覆蓋廣泛的語言範圍。
中間表示轉錄
輸出中間表示(uroman標記)的轉錄結果,便於後續處理。

模型能力

多語言語音識別
零樣本學習
語音轉錄

使用案例

語音轉錄
多語言語音轉錄
將不同語言的語音轉錄為文本,適用於多語言環境下的語音處理。
高準確率的轉錄結果,支持多種語言。
語言學習
語言學習輔助
幫助語言學習者通過語音識別學習新語言的發音和拼寫。
提供準確的語音到文本轉換,輔助學習。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase