W

Wav2vec2 Base 10k Voxpopuli Ft Fi

由facebook開發
基於Facebook Wav2Vec2基礎模型,在VoxPopuli語料庫的10K未標註子集上預訓練,並在芬蘭語轉錄數據上微調的自動語音識別模型。
下載量 24
發布時間 : 3/2/2022

模型概述

該模型是一個針對芬蘭語的自動語音識別(ASR)系統,能夠將芬蘭語語音轉換為文本。

模型特點

基於VoxPopuli語料庫
使用VoxPopuli大規模多語言語音語料庫進行預訓練,確保模型具有強大的語音理解能力
芬蘭語優化
專門針對芬蘭語進行微調,提高了對芬蘭語語音的識別準確率
端到端語音識別
直接從原始音頻輸入生成文本輸出,簡化了語音識別流程

模型能力

芬蘭語語音識別
音頻轉文本
語音轉錄

使用案例

語音轉寫
會議記錄自動化
將芬蘭語會議錄音自動轉換為文字記錄
語音助手
為芬蘭語語音助手提供語音識別能力
無障礙技術
即時字幕生成
為芬蘭語視頻內容生成即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase