F

Faster Whisper Medium

由 Systran 开发
这是OpenAI Whisper中等模型的CTranslate2转换版本,用于高效语音识别任务。
下载量 155.87k
发布时间 : 11/23/2023

模型简介

该模型是OpenAI Whisper中等模型的CTranslate2格式转换版本,专注于自动语音识别(ASR),支持多种语言,适用于需要高效语音转文本的应用场景。

模型特点

高效推理
通过CTranslate2转换,提供比原始PyTorch模型更快的推理速度
多语言支持
支持超过100种语言的语音识别
FP16量化
模型权重以FP16格式保存,平衡精度和性能
易于集成
可与faster-whisper等基于CTranslate2的项目无缝集成

模型能力

语音转文本
多语言识别
实时转录
音频文件处理

使用案例

媒体转录
播客转录
将播客音频内容自动转换为文字稿
高效准确的多语言转录
视频字幕生成
为视频内容自动生成字幕
支持多种语言的字幕创建
会议记录
会议实时转录
在会议过程中实时生成文字记录
提高会议可访问性和记录效率
语音助手
语音命令识别
为智能设备提供语音交互能力
支持多语言的语音控制
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase