W

Wav2vec2 Base 10k Voxpopuli Ft Es

由facebook開發
基於Facebook Wav2Vec2基礎模型,在VoxPopuli語料庫的10K未標註子集上預訓練,並在西班牙語轉錄數據上微調的語音識別模型。
下載量 34
發布時間 : 3/2/2022

模型概述

該模型是一個自動語音識別(ASR)系統,專門針對西班牙語語音轉錄任務進行了優化,適用於將西班牙語語音轉換為文本。

模型特點

多語言預訓練基礎
基於VoxPopuli多語言語料庫進行預訓練,具有強大的語音特徵提取能力
西班牙語專門優化
在西班牙語轉錄數據上進行微調,針對西班牙語語音特點進行了專門優化
端到端語音識別
直接從原始音頻輸入生成文本輸出,無需複雜的特徵工程

模型能力

西班牙語語音識別
音頻轉錄
語音轉文本

使用案例

語音轉錄
會議記錄自動生成
將西班牙語會議錄音自動轉錄為文字記錄
提高會議記錄效率,減少人工轉錄時間
媒體字幕生成
為西班牙語視頻內容自動生成字幕
提高媒體內容可訪問性,降低字幕製作成本
語音助手
西班牙語語音命令識別
用於西班牙語語音助手中的命令識別
提升語音交互系統的準確性和用戶體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase