M

Mms Lid 126

由facebook開發
基於Facebook大規模多語言語音項目微調的語言識別模型,支持126種語言的音頻分類
下載量 2.1M
發布時間 : 6/13/2023

模型概述

該模型基於Wav2Vec2架構,可將原始音頻輸入分類為126種語言的概率分佈,是10億參數的大規模語音識別模型

模型特點

超多語言支持
支持126種語言的語音識別,覆蓋全球主要語種
大規模模型
基於10億參數的Wav2Vec2架構,具備強大的語音特徵提取能力
高準確率
在多種語言上表現出色,準確識別不同語言的語音特徵
易用集成
可與Hugging Face Transformers庫無縫集成,方便部署使用

模型能力

語音語言識別
多語言音頻分類
即時語音分析

使用案例

語音技術應用
多語言語音助手
用於智能設備自動識別用戶語音的語言類型
準確識別126種語言,提升用戶體驗
語音內容分析
自動識別音頻流中的語言類型
支持大規模多語言語音數據處理
語音路由系統
根據識別結果將通話路由到相應語言的服務系統
提高客服系統效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase