W

Whisper Large V3

由Xenova開發
Whisper-large-v3是OpenAI開源的自動語音識別(ASR)模型,支持多種語言的語音轉文字任務。
下載量 1,443
發布時間 : 11/7/2023

模型概述

Whisper-large-v3是一個強大的自動語音識別模型,能夠將語音轉換為文本,支持多種語言。本項目將其轉換為ONNX格式,以便在Web環境中通過transformers.js庫運行。

模型特點

Web兼容性
通過ONNX轉換適配transformers.js,可在Web環境中直接運行
多語言支持
能夠識別和轉錄多種語言的語音
高準確率
在自動語音識別任務上表現優異

模型能力

語音轉文本
多語言語音識別
即時語音轉錄

使用案例

語音轉錄
會議記錄
將會議錄音自動轉換為文字記錄
提高會議記錄效率,便於後期檢索
字幕生成
為視頻內容自動生成字幕
提升視頻內容可訪問性
語音助手
語音輸入
為Web應用添加語音輸入功能
提升用戶體驗,支持無障礙訪問
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase