wav2vec2-large-960h-lv60-self_MIDIARIES_72H_FT開源語音識別模型

首頁

Wav2vec2 Large 960h Lv60 Self MIDIARIES 72H FT

由caurdy開發

基於Facebook預訓練的wav2vec2 large 960H lv60自監督模型，使用72小時MI日記數據進行微調的語音識別模型

語音識別

Transformers

#語音識別優化 #醫學日記轉錄 #微調降錯率

下載量 20

發布時間 : 4/21/2022

模型概述

該模型是專門針對醫療訪談場景優化的語音識別模型，通過微調顯著提升了在醫療對話場景下的識別準確率

模型特點

醫療場景優化

使用72小時醫療訪談數據進行微調，特別適合醫療對話場景

性能提升

在20分鐘MI日記測試集上，詞錯誤率從13%降至9.7%

基於成熟架構

基於Facebook預訓練的wav2vec2 large 960H lv60自監督模型

模型能力

英語語音識別

醫療對話轉錄

自動語音轉文本

使用案例

醫療健康

醫療訪談記錄

自動轉錄醫生與患者之間的對話

詞錯誤率降低至9.7%

醫療文檔生成

將醫療訪談錄音自動轉換為結構化文檔

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Large 960h Lv60 Self MIDIARIES 72H FT

模型概述

模型特點

模型能力

使用案例

🚀 微調版wav2vec2大模型

🚀 快速開始

模型使用

📄 許可證