P

Phi 4 Mm Inst Asr Singlish

由mjwong開發
針對新加坡英語優化的多模態語音識別模型,基於微軟Phi-4多模態指令模型微調,顯著提升對新加坡英語獨特語音特徵的識別能力。
下載量 61
發布時間 : 5/1/2025

模型概述

該模型致力於解決通用大語言模型對區域方言表徵不足的問題,特別針對新加坡英語(Singlish)的語碼轉換和獨特韻律進行優化,實現'聽-理解-自然響應'的統一模型願景。

模型特點

新加坡英語優化
專門針對新加坡英語的語碼轉換和獨特韻律特徵進行優化,顯著提升識別準確率。
多模態能力
基於Phi-4多模態指令模型,具備音頻和文本的多模態處理能力。
高效微調
僅解凍音頻相關模塊進行訓練,保持核心語言理解能力的同時高效適配新加坡英語。
智能終止
通過結束標記訓練,模型能準確判斷轉錄結束點,避免冗餘輸出。

模型能力

新加坡英語語音識別
多模態理解
語音轉錄
語音優先智能體開發

使用案例

語音轉錄
新加坡英語對話轉錄
將包含新加坡英語特色的日常對話轉錄為文本
詞錯誤率(WER)低至13.16%
智能助手
新加坡英語語音助手
開發能理解新加坡英語口音的語音優先智能助手
實現'聽-理解-自然響應'的統一模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase