W

Whisper Large Et

由TalTechNLP開發
基於OpenAI Whisper-large-v2微調的愛沙尼亞語語音識別模型,由塔爾圖理工大學開發,訓練數據約1200小時
下載量 245
發布時間 : 4/13/2023

模型概述

這是一個通用型愛沙尼亞語自動語音識別(ASR)模型,適用於廣播對話、訪談、講座等多種場景的語音轉文字任務

模型特點

高精度愛沙尼亞語識別
在Common Voice測試集上達到WER 11.35-12.03的優異表現
多樣化訓練數據
使用約1200小時的多樣化愛沙尼亞語數據訓練,包括廣播、演講、議會記錄等
基於Whisper架構
基於業界領先的Whisper-large-v2模型微調,繼承其優秀架構特性

模型能力

愛沙尼亞語語音轉文字
廣播語音識別
講座內容轉錄
訪談記錄生成

使用案例

媒體內容處理
廣播節目轉錄
將愛沙尼亞語廣播節目自動轉換為文字稿
WER約12%的高精度轉錄
訪談記錄生成
自動生成訪談對話的文字記錄
教育應用
講座內容轉錄
將大學講座內容自動轉換為文字
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase