M

Meralion AudioLLM Whisper SEA LION

由MERaLiON開發
專為新加坡多語言多元文化環境定製的語音-文本大語言模型,整合Whisper-large-v2語音編碼器和SEA-LION V3文本解碼器
下載量 2,828
發布時間 : 11/22/2024

模型概述

針對新加坡本地口音和方言的多樣化語言細微差別進行優化,支持多種語音文本轉換任務

模型特點

本地化優化
專門針對新加坡本地口音、方言和語碼轉換進行優化
多任務支持
支持6種不同語音文本轉換任務
高效推理
支持vLLM框架實現閃電級推理速度
大規模訓練
基於26萬小時語音音頻數據進行訓練

模型能力

語音識別
語音翻譯
口語問答
對話摘要
語音指令理解
副語言學分析

使用案例

語音轉錄
句子級語音識別
將單句語音轉換為文本
準確轉錄新加坡口音的英語
對話級語音識別
將對話語音轉換為帶說話人標籤的文本
支持多說話人識別和語碼轉換
語音理解
口語對話摘要
從對話語音中提取關鍵信息生成摘要
準確捕捉對話核心內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase