Icefall Asr Gigaspeech Conformer Ctc
模型概述
Icefall 是一個用於自動語音識別(ASR)的工具包,基於 k2 框架構建,支持高效的模型訓練和推理。它適用於多種語音識別任務,並提供了靈活的配置選項。
模型特點
高效訓練與推理
基於 k2 框架,Icefall 提供了高效的訓練和推理能力,適用於大規模語音識別任務。
靈活配置
支持多種模型配置和參數調整,便於用戶根據需求定製語音識別模型。
支持多種語音識別任務
適用於多種語音識別場景,包括但不限於即時語音識別和離線語音識別。
模型能力
語音識別
音頻處理
模型訓練
模型推理
使用案例
語音轉文字
即時語音轉文字
將即時語音流轉換為文字,適用於會議記錄、即時字幕等場景。
高準確率的即時語音識別
離線語音轉文字
對錄製的音頻文件進行語音識別,生成文字記錄。
高效的離線語音處理
語音助手
語音指令識別
識別用戶的語音指令,用於智能家居、車載系統等場景。
快速響應和高準確率
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98