🚀 阿拉伯語-Whisper代碼切換版
該模型是基於OpenAI的Whisper Large v2微調而來,在阿拉伯語 - 英語代碼切換數據集上進行訓練。它能夠處理包含嵌入式英語單詞的阿拉伯語音頻,提升了原模型在阿拉伯語 - 英語代碼切換語音上的性能。

🚀 快速開始
使用以下代碼開始使用該模型:
from transformers import WhisperForConditionalGeneration, WhisperProcessor
processor = WhisperProcessor.from_pretrained("MohamedRashad/Arabic-Whisper-CodeSwitching-Edition")
model = WhisperForConditionalGeneration.from_pretrained("MohamedRashad/Arabic-Whisper-CodeSwitching-Edition")
inputs = processor("path_to_audio_file.wav", return_tensors="pt")
generated_ids = model.generate(inputs["input_features"])
transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)
print(transcription)
✨ 主要特性
- 專為處理包含嵌入式英語單詞的阿拉伯語音頻而設計。
- 基於Whisper Large v2微調,提升了在阿拉伯語 - 英語代碼切換語音上的性能。
📚 詳細文檔
📝 模型詳情
模型描述
阿拉伯語 - Whisper代碼切換版旨在處理包含嵌入式英語單詞的阿拉伯語音頻。該模型通過提升在阿拉伯語 - 英語代碼切換語音上的性能,改進了原始的Whisper Large v2。
屬性 |
詳情 |
開發者 |
العبد لله |
模型類型 |
語音識別 |
語言 |
阿拉伯語、英語(在阿拉伯語音頻語境中) |
許可證 |
GPL - 3.0 |
模型來源
- 數據收集倉庫:https://github.com/MohamedAliRashad/youtube-audio-collector
- 演示:https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition
👷 用途
直接使用
該模型可直接用於轉錄包含英語單詞的阿拉伯語語音。在代碼切換常見的多語言環境中特別有用。
超出範圍的使用
該模型在非阿拉伯語或英語的單語語音,或非阿拉伯語和英語的代碼切換語音上可能表現不佳。
😨 偏差、風險和侷限性
建議
用戶(直接用戶和下游用戶)應瞭解該模型的風險、偏差和侷限性。如需進一步建議,還需更多信息。
📄 許可證
本模型使用GPL - 3.0許可證。
👨🎓 引用
BibTeX
@misc{rashad2024arabicwhisper,
title={Arabic-Whisper-CodeSwitching-Edition},
author={Mohamed Rashad},
year={2024},
url={https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition},
}
APA
Rashad, M. (2024). Arabic-Whisper-CodeSwitching-Edition. Retrieved from https://huggingface.co/spaces/MohamedRashad/Arabic-Whisper-CodeSwitching-Edition