S

SIMS Llama3.2 3B

由slprl開發
該模型是基於Llama-3.2-3B微調的語音語言模型,專注於分析交錯語音-文本SLM的擴展性,支持語音和文本的生成任務。
下載量 54
發布時間 : 4/2/2025

模型概述

這是一個語音語言模型(SLM),用於在給定語音-文本提示的情況下,基於離散的Hubert標記生成語音或文本延續。

模型特點

高效擴展性
通過交錯語音-文本初始化,顯著提高了計算擴展效率,相比純語音SLM更高效。
知識遷移
從預訓練的文本語言模型(TextLM)初始化,實現了知識遷移,提升了模型性能。
多模態支持
支持語音和文本的生成任務,能夠處理跨模態任務,如根據語音提示生成文本延續。

模型能力

語音生成
文本生成
跨模態任務處理

使用案例

語音生成
語音片段延續
根據給定的語音提示生成語音片段的延續。
跨模態任務
語音到文本生成
根據語音提示生成文本延續。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase