W

Wav2vec2 Xl 960h Dementiabank

由shields開發
該模型是基於facebook/wav2vec2-large-960h在DementiaBank數據集上微調的語音識別模型,主要用於語音轉文本任務。
下載量 20
發布時間 : 3/2/2022

模型概述

這是一個基於wav2vec2架構的語音識別模型,經過微調後可能特別適用於老年痴呆症患者的語音識別場景。

模型特點

高精度語音識別
基於wav2vec2-xl架構,提供高質量的語音轉文本能力
特定領域微調
在DementiaBank數據集上微調,可能更適合識別老年痴呆症患者的語音特徵
預訓練基礎
基於facebook/wav2vec2-large-960h預訓練模型,具有強大的語音理解能力

模型能力

英語語音識別
語音轉文本
特定人群語音識別

使用案例

醫療健康
老年痴呆症患者語音分析
用於識別和分析老年痴呆症患者的語音特徵
語音轉錄
醫療訪談記錄
將醫生與患者的對話自動轉錄為文字
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase