W

Whisper Large V3 Lv Late Cv19

由AiLab-IMCS-UL開發
基於whisper-large-v3微調的拉脫維亞語自動語音識別模型,由AiLab.lv訓練,支持拉脫維亞語語音轉文本任務。
下載量 162
發布時間 : 10/15/2024

模型概述

該模型是基於OpenAI的whisper-large-v3架構微調的拉脫維亞語自動語音識別(ASR)模型,專門針對拉脫維亞語優化,能夠準確地將拉脫維亞語音頻轉換為文本。

模型特點

多數據集訓練
結合Common Voice 19.0和LATE-Media 2.0兩個數據集進行訓練,總訓練時長282.4小時。
多種量化版本
提供適用於whisper.cpp的GGML格式4位、5位和8位量化版本,以及CTranslate2的8位量化版本。
低詞錯誤率
在Common Voice 19.0測試集上達到3.2%的詞錯誤率(WER),表現優異。

模型能力

拉脫維亞語語音識別
音頻轉文本
語音轉錄

使用案例

語音轉錄
廣播內容轉錄
將拉脫維亞廣播內容自動轉錄為文本
在LATE-Media測試集上達到12.8%的詞錯誤率
通用語音轉錄
日常拉脫維亞語語音的轉錄
在Common Voice測試集上達到3.2%的詞錯誤率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase