E

Erax WoW Turbo V1.1 CT2

由erax-ai開發
基於CTranslate2優化的Whisper Large-v3 Turbo越南語增強本地化版,支持多語言語音識別,速度快、準確度高
下載量 1,283
發布時間 : 3/31/2025

模型概述

這是一個優化的語音轉文本模型,基於Whisper Large-v3 Turbo架構,特別針對越南語進行了增強,同時支持多種語言。模型經過CTranslate2優化,提供極速轉錄能力。

模型特點

極速轉錄
處理30秒音頻僅需約350毫秒,支持即時轉錄
多語言支持
支持11種語言,特別針對越南語8種地區口音優化
高準確度
在主要語言中詞錯率(WER)約為12%,能處理各種口音
CTranslate2優化
通過CTranslate2庫實現2.5倍加速,適合低延遲應用

模型能力

語音轉文本
多語言識別
即時轉錄
口音適應

使用案例

即時轉錄
會議記錄
即時轉錄會議內容
幾乎即時的文字記錄
採訪記錄
自動轉錄採訪音頻
快速準確的採訪記錄
無障礙工具
聽力輔助
為聽力障礙人士提供即時字幕
提高溝通可及性
媒體制作
視頻字幕
自動為視頻生成字幕
快速準確的字幕生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase