Arabic-Whisper-CodeSwitching-Edition开源模型 - 免费实现阿拉伯语-英语语码转换语音识别

首页

Arabic Whisper CodeSwitching Edition

由 MohamedRashad 开发

基于Whisper Large v2微调的阿拉伯语-英语语码转换语音识别模型

语音识别

Transformers

支持多种语言开源协议:Gpl-3.0 #阿拉伯语-英语混合语音识别 #语码转换优化 #多语言语音转录

下载量 1,761

发布时间 : 7/6/2024

模型简介

专为处理含有英语词汇的阿拉伯语音频设计的语音识别模型，提升阿拉伯语-英语语码转换语音的识别性能

模型特点

语码转换优化

专门针对阿拉伯语-英语混合语音进行优化，能准确识别语码转换内容

多语言支持

同时支持阿拉伯语和英语的识别，特别适合多语言环境

基于Whisper架构

基于强大的Whisper Large v2模型微调，继承了其优秀的语音识别能力

模型能力

阿拉伯语语音识别

英语语音识别

语码转换语音处理

使用案例

语音转录

阿拉伯语-英语混合语音转录

转录包含英语词汇的阿拉伯语语音内容

相比原版Whisper模型，在语码转换语音上识别率更高

多语言应用

多语言会议记录

用于记录阿拉伯语为主但包含英语术语的会议内容

🚀 阿拉伯语-Whisper代码切换版

该模型是基于OpenAI的Whisper Large v2微调而来，在阿拉伯语 - 英语代码切换数据集上进行训练。它能够处理包含嵌入式英语单词的阿拉伯语音频，提升了原模型在阿拉伯语 - 英语代码切换语音上的性能。

image/png

🚀 快速开始

使用以下代码开始使用该模型：

from transformers import WhisperForConditionalGeneration, WhisperProcessor

processor = WhisperProcessor.from_pretrained("MohamedRashad/Arabic-Whisper-CodeSwitching-Edition")
model = WhisperForConditionalGeneration.from_pretrained("MohamedRashad/Arabic-Whisper-CodeSwitching-Edition")

# 示例用法
inputs = processor("path_to_audio_file.wav", return_tensors="pt")
generated_ids = model.generate(inputs["input_features"])
transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)
print(transcription)

✨ 主要特性

专为处理包含嵌入式英语单词的阿拉伯语音频而设计。
基于Whisper Large v2微调，提升了在阿拉伯语 - 英语代码切换语音上的性能。

📚 详细文档

📝 模型详情

模型描述

阿拉伯语 - Whisper代码切换版旨在处理包含嵌入式英语单词的阿拉伯语音频。该模型通过提升在阿拉伯语 - 英语代码切换语音上的性能，改进了原始的Whisper Large v2。

属性	详情
开发者	العبد لله
模型类型	语音识别
语言	阿拉伯语、英语（在阿拉伯语音频语境中）
许可证	GPL - 3.0

模型来源

数据收集仓库：https://github.com/MohamedAliRashad/youtube-audio-collector
演示：https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition

👷 用途

直接使用

该模型可直接用于转录包含英语单词的阿拉伯语语音。在代码切换常见的多语言环境中特别有用。

超出范围的使用

该模型在非阿拉伯语或英语的单语语音，或非阿拉伯语和英语的代码切换语音上可能表现不佳。

😨 偏差、风险和局限性

建议

用户（直接用户和下游用户）应了解该模型的风险、偏差和局限性。如需进一步建议，还需更多信息。

📄 许可证

本模型使用GPL - 3.0许可证。

👨‍🎓 引用

BibTeX

@misc{rashad2024arabicwhisper,
  title={Arabic-Whisper-CodeSwitching-Edition},
  author={Mohamed Rashad},
  year={2024},
  url={https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition},
}

APA

Rashad, M. (2024). Arabic-Whisper-CodeSwitching-Edition. Retrieved from https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition