I

Ichigo Llama3.1 S Instruct V0.4

由Menlo開發
基於Llama-3架構的多模態語言模型,支持音頻和文本輸入理解,在嘈雜環境下具有更強的魯棒性和多輪對話能力。
下載量 44
發布時間 : 11/8/2024

模型概述

該模型是Homebrew Research開發的Ichigo-llama3s系列模型之一,通過監督微調增強了音頻理解能力,適用於研究應用。

模型特點

多模態輸入支持
原生支持音頻和文本輸入理解
噪聲環境魯棒性
在嘈雜環境輸入下表現出更強的魯棒性
增強多輪對話
通過訓練數據增強多輪對話能力

模型能力

音頻理解
文本生成
多輪對話
噪聲環境處理

使用案例

語音交互研究
嘈雜環境語音理解
在背景噪聲較大的環境中準確理解語音指令
相比前代模型提升約10%的識別準確率
多輪語音對話系統
構建支持上下文理解的語音對話系統
在MMLU評估中獲得64.66分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase