C

Crisperwhisper

由unsloth開發
CrisperWhisper是OpenAI Whisper的進階版本,專為快速、精準且逐字記錄的語音識別設計,提供準確(清晰)的詞級時間戳。
下載量 50
發布時間 : 5/14/2025

模型概述

CrisperWhisper是Whisper的改進版本,旨在精確轉錄每一個口語詞彙,包括填充詞、停頓、結巴和錯誤起始,提供更準確的詞級時間戳。

模型特點

精確詞級時間戳
通過調整分詞器及訓練中定製注意力損失,提供精確時間戳,即使在不流暢和停頓處也能準確標記。
逐字轉錄
如實轉錄每個口語詞彙,區分並記錄如'um'和'uh'等填充詞。
填充詞檢測
準確檢測並轉錄填充詞。
減少幻覺
最小化轉錄幻覺,提升準確性。

模型能力

語音識別
詞級時間戳生成
填充詞檢測
多語言支持

使用案例

語音轉錄
會議記錄
精確記錄會議中的每一個詞彙,包括停頓和填充詞。
提供更完整的會議記錄,便於後期分析。
訪談轉錄
轉錄訪談內容,保留所有口語特徵。
更真實的訪談記錄,便於研究口語表達。
語音分析
口語分析
分析口語中的填充詞和停頓模式。
幫助語言學家研究口語特徵。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase