Whisper Small Ko Low Qual Voice
模型简介
本模型是基于Whisper-small架构微调的韩语自动语音识别模型,适用于多种韩语语音处理场景,如对话、广播、新闻等。
模型特点
精准识别
在韩语语音识别任务上表现出色,能准确转录韩语语音内容。
多场景适用
可用于离线或批量转录韩语语音数据,也可集成到韩语语音助手系统中。
可扩展性强
支持在特定领域数据集上进一步微调,如法律、医疗、教育等。
模型能力
韩语语音识别
语音转录
语音助手集成
使用案例
语音转录
离线语音转录
用于批量转录韩语语音数据。
语音助手集成
集成到韩语语音助手系统中。
领域特定应用
法律领域
在法律领域数据集上进一步微调,用于法律语音转录。
医疗领域
在医疗领域数据集上进一步微调,用于医疗语音转录。
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2