G

Gigaam Ctc With Lm

由waveletdeboshir開發
俄語自動語音識別模型,支持外部ngram語言模型和束搜索解碼,可提取詞級時間戳
下載量 30
發布時間 : 5/13/2025

模型概述

這是一個基於Conformer架構的俄語語音識別模型,集成了transformers庫接口,支持使用外部ngram語言模型進行重打分和束搜索解碼,同時具備詞級時間戳提取功能。

模型特點

語言模型集成
支持外部ngram語言模型重打分,提高識別準確率
束搜索解碼
使用束搜索算法進行解碼,優化識別結果
時間戳提取
可提取詞級時間戳,支持語音對齊分析
Transformers兼容
完全兼容Hugging Face transformers庫,便於集成

模型能力

俄語語音識別
語音轉文字
詞級時間戳提取

使用案例

語音轉錄
俄語會議記錄
將俄語會議錄音自動轉換為文字記錄
生成帶時間戳的會議文字稿
媒體字幕生成
為俄語視頻內容自動生成字幕
同步的字幕文件
語音分析
語音內容分析
分析俄語語音內容並提取關鍵詞
帶時間標記的關鍵詞列表
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase