W

Wav2vec2 Large Xlsr 53 Georgian

由MehdiHosseiniMoghadam開發
這是一個基於facebook/wav2vec2-large-xlsr-53模型微調的格魯吉亞語自動語音識別(ASR)模型,使用Common Voice數據集進行訓練。
下載量 44
發布時間 : 3/2/2022

模型概述

該模型專門用於格魯吉亞語的語音識別任務,能夠將格魯吉亞語語音轉換為文本。

模型特點

格魯吉亞語專用
專門針對格魯吉亞語優化的語音識別模型
基於XLSR-53
基於強大的wav2vec2-large-xlsr-53模型微調
Common Voice數據集訓練
使用Common Voice的格魯吉亞語數據集進行訓練

模型能力

格魯吉亞語語音識別
音頻轉文本
16kHz採樣率音頻處理

使用案例

語音轉寫
格魯吉亞語語音轉錄
將格魯吉亞語語音內容轉換為文本
在Common Voice測試集上WER為60.5%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase