K

Kimi Audio 7B Instruct

由moonshotai開發
金鳴音頻是一個在音頻理解、生成與對話方面表現卓越的開源音頻基礎模型,支持多種音頻處理任務。
下載量 1,626
發布時間 : 4/25/2025

模型概述

金鳴音頻是一個通用音頻基礎模型,能在統一框架下處理多種音頻處理任務,包括語音識別、音頻問答、音頻描述、語音情感識別等。

模型特點

全能處理能力
支持多種音頻處理任務,包括語音識別、音頻問答、音頻描述、語音情感識別等。
頂尖性能表現
在多項音頻基準測試中達到最先進水平。
超大規模預訓練
基於超1300萬小時的多樣化音頻數據(語音/音樂/環境聲)及文本數據訓練。
創新架構設計
採用混合音頻輸入與並行生成文本/音頻標記的大語言模型核心架構。
高效推理部署
配備基於流匹配的塊流式解碼器,實現低延遲音頻生成。

模型能力

音頻理解
音頻生成
語音識別
音頻問答
音頻描述
語音情感識別
聲學事件分類
聲學場景分類
端到端語音對話

使用案例

語音識別
音頻轉文本
將音頻文件轉換為文本內容。
高準確率的文本輸出。
多模態對話
音頻對話生成
根據輸入的音頻生成對話響應。
生成自然的對話音頻和文本。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase