🚀 阿拉伯语-Whisper代码切换版
该模型是基于OpenAI的Whisper Large v2微调而来,在阿拉伯语 - 英语代码切换数据集上进行训练。它能够处理包含嵌入式英语单词的阿拉伯语音频,提升了原模型在阿拉伯语 - 英语代码切换语音上的性能。

🚀 快速开始
使用以下代码开始使用该模型:
from transformers import WhisperForConditionalGeneration, WhisperProcessor
processor = WhisperProcessor.from_pretrained("MohamedRashad/Arabic-Whisper-CodeSwitching-Edition")
model = WhisperForConditionalGeneration.from_pretrained("MohamedRashad/Arabic-Whisper-CodeSwitching-Edition")
inputs = processor("path_to_audio_file.wav", return_tensors="pt")
generated_ids = model.generate(inputs["input_features"])
transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)
print(transcription)
✨ 主要特性
- 专为处理包含嵌入式英语单词的阿拉伯语音频而设计。
- 基于Whisper Large v2微调,提升了在阿拉伯语 - 英语代码切换语音上的性能。
📚 详细文档
📝 模型详情
模型描述
阿拉伯语 - Whisper代码切换版旨在处理包含嵌入式英语单词的阿拉伯语音频。该模型通过提升在阿拉伯语 - 英语代码切换语音上的性能,改进了原始的Whisper Large v2。
属性 |
详情 |
开发者 |
العبد لله |
模型类型 |
语音识别 |
语言 |
阿拉伯语、英语(在阿拉伯语音频语境中) |
许可证 |
GPL - 3.0 |
模型来源
- 数据收集仓库:https://github.com/MohamedAliRashad/youtube-audio-collector
- 演示:https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition
👷 用途
直接使用
该模型可直接用于转录包含英语单词的阿拉伯语语音。在代码切换常见的多语言环境中特别有用。
超出范围的使用
该模型在非阿拉伯语或英语的单语语音,或非阿拉伯语和英语的代码切换语音上可能表现不佳。
😨 偏差、风险和局限性
建议
用户(直接用户和下游用户)应了解该模型的风险、偏差和局限性。如需进一步建议,还需更多信息。
📄 许可证
本模型使用GPL - 3.0许可证。
👨🎓 引用
BibTeX
@misc{rashad2024arabicwhisper,
title={Arabic-Whisper-CodeSwitching-Edition},
author={Mohamed Rashad},
year={2024},
url={https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition},
}
APA
Rashad, M. (2024). Arabic-Whisper-CodeSwitching-Edition. Retrieved from https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition