Whisper Small Ko Low Qual Voice
模型概述
本模型是基於Whisper-small架構微調的韓語自動語音識別模型,適用於多種韓語語音處理場景,如對話、廣播、新聞等。
模型特點
精準識別
在韓語語音識別任務上表現出色,能準確轉錄韓語語音內容。
多場景適用
可用於離線或批量轉錄韓語語音數據,也可集成到韓語語音助手系統中。
可擴展性強
支持在特定領域數據集上進一步微調,如法律、醫療、教育等。
模型能力
韓語語音識別
語音轉錄
語音助手集成
使用案例
語音轉錄
離線語音轉錄
用於批量轉錄韓語語音數據。
語音助手集成
集成到韓語語音助手系統中。
領域特定應用
法律領域
在法律領域數據集上進一步微調,用於法律語音轉錄。
醫療領域
在醫療領域數據集上進一步微調,用於醫療語音轉錄。
精選推薦AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多語言圖像描述任務。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根據文本提示生成高質量圖像。該模型在優化推理效率的同時,將性能損失降至最低。
圖像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
這是一個基於Qwen2.5-VL-7B模型的靜態量化版本,專注於圖像描述生成任務,支持多種語言。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。
圖像生成文本
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基於Qwen3-1.7B開發的專注於代理式網絡搜索和輕量級瀏覽的模型,在移動設備上也能高效運行。
大型語言模型
Transformers 英語

L
Mungert
263
2