Whisper Small Gl

W

Whisper Small Gl

Developed by mozilla-ai

基于Mozilla Common Voice数据集中35141个加利西亚语样本微调的Whisper-small语音识别模型

OtherOpen Source License:Apache-2.0 #加利西亚语语音识别 #低词错误率(13.68%)#Common Voice数据集优化

Downloads 46

Release Time : 2/18/2025

Model Overview

针对加利西亚语优化的自动语音识别(ASR)模型，显著提升加利西亚语的转录准确率

Model Features

加利西亚语优化

专门针对加利西亚语进行微调，词错误率从40.812降至13.681

基于Common Voice数据

使用Mozilla Common Voice数据集中35141个高质量加利西亚语样本训练

Whisper架构

基于OpenAI Whisper-small架构，具备良好的语音识别基础能力

Model Capabilities

加利西亚语语音识别

长句语音转录

多领域语音转文本

Use Cases

语音转录

加利西亚语会议记录

将加利西亚语会议录音自动转录为文字

词错误率13.681

语音内容存档

将加利西亚语语音内容转换为可搜索的文本

Featured Recommended AI Models

Qwen2.5 VL 7B Abliterated Caption It I1 GGUF

Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本，支持多语言图像描述任务。

图像生成文本

Transformers Supports Multiple Languages

Nunchaku Flux.1 Dev Colossus

Colossus Project Flux 的 Nunchaku 量化版本，旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时，将性能损失降至最低。

图像生成 English

Qwen2.5 VL 7B Abliterated Caption It GGUF

这是一个基于Qwen2.5-VL-7B模型的静态量化版本，专注于图像描述生成任务，支持多种语言。

图像生成文本

Transformers Supports Multiple Languages

Olmocr 7B 0725 FP8

olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型，使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。

图像生成文本

Transformers English

Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型，在移动设备上也能高效运行。

大型语言模型

Transformers English

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase