W

Wav2vec2 Tcrs

由neelan-elucidate-ai開發
基於facebook/wav2vec2-large-lv60微調的語音識別模型,在評估集上取得1.0657的詞錯誤率
下載量 20
發布時間 : 5/4/2022

模型概述

該模型是用於語音識別任務的微調模型,基於wav2vec2架構,適用於將語音轉換為文本的應用場景。

模型特點

低詞錯誤率
在評估集上取得了1.0657的詞錯誤率,表現優異
基於wav2vec2架構
採用facebook/wav2vec2-large-lv60作為基礎模型,具有強大的語音特徵提取能力
精細調優
經過100輪精細調優訓練,模型性能得到顯著提升

模型能力

語音轉文本
自動語音識別

使用案例

語音轉錄
會議記錄自動生成
將會議錄音自動轉換為文字記錄
高準確率的轉錄結果
語音助手
用於語音助手的語音識別模塊
快速準確的語音理解
無障礙應用
即時字幕生成
為聽力障礙人士提供即時字幕服務
低延遲高準確率的字幕輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase