W

Wav2vec2 Large Xlsr 53 Finnish

Developed by Tommi
基於facebook/wav2vec2-large-xlsr-53模型微調的芬蘭語自動語音識別模型,支持16kHz採樣率的語音輸入。
Downloads 28
Release Time : 3/2/2022

Model Overview

該模型是針對芬蘭語優化的自動語音識別(ASR)模型,基於XLSR-53架構,在通用語音庫、CSS10和芬蘭議會會議記錄等數據集上微調而成。

Model Features

多數據集微調
結合了通用語音庫、CSS10和芬蘭議會會議記錄三個數據集進行訓練,提高模型適應性
無需語言模型
可直接使用進行語音識別,無需額外語言模型支持
16kHz採樣率支持
專為16kHz採樣率的語音輸入優化

Model Capabilities

芬蘭語語音識別
音頻轉文本
語音內容分析

Use Cases

語音轉錄
會議記錄自動轉錄
將芬蘭議會會議等正式場合的語音內容轉換為文本
語音筆記轉換
將個人語音備忘錄轉換為可編輯文本
語音助手
芬蘭語語音指令識別
為芬蘭語語音助手提供核心識別能力
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase