I

Ichigo Llama3.1 S Base V0.3

由Menlo開發
Llama3-S 是一個支持音頻和文本輸入的多模態語言模型,基於 Llama-3 架構開發,專注於提升語音理解能力。
下載量 18
發布時間 : 9/9/2024

模型概述

該模型在擴展詞彙表基礎上進行了持續預訓練,原生支持音頻和文本輸入,主要用於研究應用,特別是語音理解方面的能力提升。

模型特點

多模態輸入支持
原生支持音頻和文本輸入,能夠處理語音和文本數據。
語音理解優化
通過持續預訓練和擴展詞彙表,顯著提升了語音理解能力。
高效訓練
使用最新的 FSDP2 訓練代碼,優化了訓練效率和資源利用。

模型能力

音頻轉文本
文本生成
語音理解

使用案例

研究應用
語音理解研究
用於研究大語言模型在語音理解方面的能力提升。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase