F

Fireredasr AED L

由FireRedTeam開發
FireRedASR是一系列支持普通話、漢語方言和英語的開源工業級自動語音識別(ASR)模型,在公開普通話ASR基準測試中達到最新最優(SOTA)水平,同時具備卓越的歌詞識別能力。
下載量 216
發布時間 : 1/24/2025

模型概述

FireRedASR為滿足不同應用場景對卓越性能和最優效率的多樣化需求,設計了兩類變體:FireRedASR-LLM和FireRedASR-AED。前者採用編碼器-適配器-大語言模型框架,旨在實現SOTA性能並支持端到端語音交互;後者基於注意力機制的編碼器-解碼器架構,平衡高性能與計算效率,可作為基於LLM的語音模型中的高效語音表徵模塊。

模型特點

多語言支持
支持普通話、漢語方言和英語的自動語音識別
工業級性能
在公開普通話ASR基準測試中達到SOTA水平
卓越的歌詞識別能力
具備優秀的歌詞識別性能
兩種架構選擇
提供LLM和AED兩種架構,滿足不同場景需求

模型能力

普通話語音識別
漢語方言語音識別
英語語音識別
歌詞識別

使用案例

語音轉文字
會議記錄
將會議錄音轉換為文字記錄
在ws_meeting數據集上CER為4.67%
語音助手
用於智能語音助手中的語音識別模塊
多媒體處理
字幕生成
為視頻內容自動生成字幕
歌詞識別
從音樂中識別歌詞
具備卓越的歌詞識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase