faster-whisper-medium开源语音识别模型 - 高效完成各类语音识别任务

首页

Faster Whisper Medium

由 Systran 开发

这是OpenAI Whisper中等模型的CTranslate2转换版本，用于高效语音识别任务。

语音识别支持多种语言开源协议:MIT #多语言语音识别 #实时音频转写 #FP16高效推理

下载量 155.87k

发布时间 : 11/23/2023

模型简介

该模型是OpenAI Whisper中等模型的CTranslate2格式转换版本，专注于自动语音识别(ASR)，支持多种语言，适用于需要高效语音转文本的应用场景。

模型特点

高效推理

通过CTranslate2转换，提供比原始PyTorch模型更快的推理速度

多语言支持

支持超过100种语言的语音识别

FP16量化

模型权重以FP16格式保存，平衡精度和性能

易于集成

可与faster-whisper等基于CTranslate2的项目无缝集成

模型能力

语音转文本

多语言识别

实时转录

音频文件处理

使用案例

媒体转录

播客转录

将播客音频内容自动转换为文字稿

高效准确的多语言转录

视频字幕生成

为视频内容自动生成字幕

支持多种语言的字幕创建

会议记录

会议实时转录

在会议过程中实时生成文字记录

提高会议可访问性和记录效率

语音助手

语音命令识别

为智能设备提供语音交互能力

支持多语言的语音控制

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Faster Whisper Medium

模型简介

模型特点

模型能力

使用案例

🚀 CTranslate2版Whisper中型模型

🚀 快速开始

💻 使用示例

基础用法

🔧 技术细节

转换详情

更多信息

📄 许可证

其他信息

支持语言

标签

库名称