B

Base 10k 8khz Pt

由lgris開發
基於facebook/wav2vec2-base-10k-voxpopuli微調的葡萄牙語自動語音識別模型,支持8kHz採樣率
下載量 28
發布時間 : 3/2/2022

模型概述

這是一個針對葡萄牙語優化的自動語音識別(ASR)模型,基於Wav2vec 2.0架構,使用多個葡萄牙語語音數據集進行微調。

模型特點

多數據集微調
使用CETUC、Common Voice、Lapsbm等多個葡萄牙語語音數據集進行微調,提高識別準確性
8kHz採樣率支持
優化支持8kHz採樣率的語音輸入,適應更多實際應用場景
巴西葡萄牙語優化
特別針對巴西葡萄牙語變體進行優化,識別效果更好

模型能力

葡萄牙語語音識別
音頻轉文本
支持8kHz採樣率輸入

使用案例

語音轉錄
會議記錄自動轉錄
將葡萄牙語會議錄音自動轉換為文字記錄
語音筆記轉換
將葡萄牙語語音筆記轉換為可編輯文本
無障礙應用
即時字幕生成
為葡萄牙語視頻內容生成即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase