S

SIMS 7B

由slprl開發
基於Qwen2.5-7B擴展的語音語言模型,支持語音-文本交錯訓練和跨模態生成
下載量 51
發布時間 : 3/31/2025

模型概述

該模型通過擴展Qwen2.5-7B的詞彙表實現微調,新增500個語音token,專注於交錯式語音-文本SLM的擴展性研究,可用於生成語音片段延續或跨模態生成

模型特點

高效擴展性
相比純語音SLM具有更高的計算資源利用效率,擴展動力學特徵與純語音SLM存在本質差異
跨模態生成
支持根據語音提示生成文本延續,或根據語音-文本提示生成語音延續
知識遷移
通過語音-文本交錯訓練方式從預訓練文本語言模型初始化,實現知識遷移

模型能力

語音片段延續生成
語音到文本跨模態生成
語音-文本交錯處理

使用案例

語音生成
語音延續生成
根據輸入的語音片段生成自然的語音延續
在語音語義指標上與主流模型性能相當
跨模態應用
語音到文本生成
根據語音提示生成相關的文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase