Wavlm Bert Fusion S Emotion Russian Resd
W
Wavlm Bert Fusion S Emotion Russian Resd
由Aniemore開發
基於WavLM和BERT的多模態融合模型,適用於語音和文本的聯合任務處理。
下載量 298
發布時間 : 5/2/2023
模型概述
該模型結合了WavLM的語音處理能力和BERT的文本理解能力,通過特定的融合策略(k=2, s, resd=1)實現跨模態信息交互。
模型特點
跨模態融合
通過創新的融合策略整合語音和文本特徵
高效架構
結合WavLM和BERT的優勢,實現高效的多模態處理
參數優化
採用特定的融合參數配置(k=2, s, resd=1)平衡性能與效率
模型能力
語音特徵提取
文本理解
跨模態信息融合
語音文本聯合任務處理
使用案例
語音文本對齊
語音轉文本質量評估
評估ASR系統輸出的文本與原始語音的語義一致性
多模態情感分析
語音文本聯合情感識別
同時分析語音內容和文本內容的情感傾向
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98