W

Whisper Large V3 Distil Multi7 V0.2

由bofenghuang開發
一個多語言蒸餾版Whisper模型,支持7種歐洲語言的自動語音識別,具有語碼轉換能力
下載量 119
發布時間 : 12/5/2024

模型概述

這是一個基於Whisper-Large-v3的蒸餾模型,專為7種歐洲語言(英語、法語、西班牙語、德語、意大利語、葡萄牙語和荷蘭語)的自動語音識別優化。模型具有2個解碼器層,特別支持語碼轉換功能,能自動檢測並處理多語言混合的語音輸入。

模型特點

多語言支持
支持7種歐洲語言的語音識別(英語、法語、西班牙語、德語、意大利語、葡萄牙語和荷蘭語)
語碼轉換能力
能夠自動檢測語音中的語言變化並生成相應的語言標記,實現無縫的多語言轉錄
高效蒸餾架構
僅保留2個解碼器層,在保持良好性能的同時提高推理效率

模型能力

自動語音識別
多語言轉錄
語碼轉換檢測
語音到文本轉換

使用案例

多語言轉錄
多語言會議記錄
自動轉錄包含多種語言的會議錄音
能準確識別語言切換並生成相應語言的文本
多語言媒體內容處理
處理包含多種語言的播客、視頻等媒體內容
生成帶語言標記的轉錄文本
語音分析
多語言語音數據分析
分析包含多種語言的語音數據集
提供準確的文本轉錄用於後續分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase