🚀 Wav2Vec2-Large-XLSR-53-摩洛哥达里贾语模型
本项目基于Wav2Vec2-Large-XLSR-53模型,针对摩洛哥达里贾语进行了微调,能够有效实现摩洛哥达里贾语的自动语音识别,为相关语音处理任务提供了有力支持。
🚀 快速开始
本模型可以直接按以下步骤使用:
import librosa
import torch
from transformers import Wav2Vec2CTCTokenizer, Wav2Vec2ForCTC, Wav2Vec2Processor, TrainingArguments, Wav2Vec2FeatureExtractor, Trainer
tokenizer = Wav2Vec2CTCTokenizer("./vocab.json", unk_token="[UNK]", pad_token="[PAD]", word_delimiter_token="|")
processor = Wav2Vec2Processor.from_pretrained('boumehdi/wav2vec2-large-xlsr-moroccan-darija', tokenizer=tokenizer)
model=Wav2Vec2ForCTC.from_pretrained('boumehdi/wav2vec2-large-xlsr-moroccan-darija')
input_audio, sr = librosa.load('file.wav', sr=16000)
input_values = processor(input_audio, return_tensors="pt", padding=True).input_values
logits = model(input_values).logits
tokens = torch.argmax(logits, axis=-1)
transcription = tokenizer.batch_decode(tokens)
print(transcription)
输出示例:قالت ليا هاد السيد هادا ما كاينش بحالو
✨ 主要特性
- 数据来源优质:在从MDVC(https://ijeecs.iaescore.com/index.php/IJEECS/article/view/35709)中提取的57小时标注达里贾语音频上进行了微调,该数据集包含超过1000小时的摩洛哥达里贾语“ary”。
- 持续优化:模型正在进行全天候的微调以提高准确性。
- 数据持续更新:每天都会持续为模型添加数据,并且会逐步规范摩洛哥达里贾语的书写方式。
📦 安装指南
暂未提供相关安装步骤,可参考代码中的依赖库进行安装,如librosa
、torch
、transformers
等。
💻 使用示例
基础用法
import librosa
import torch
from transformers import Wav2Vec2CTCTokenizer, Wav2Vec2ForCTC, Wav2Vec2Processor, TrainingArguments, Wav2Vec2FeatureExtractor, Trainer
tokenizer = Wav2Vec2CTCTokenizer("./vocab.json", unk_token="[UNK]", pad_token="[PAD]", word_delimiter_token="|")
processor = Wav2Vec2Processor.from_pretrained('boumehdi/wav2vec2-large-xlsr-moroccan-darija', tokenizer=tokenizer)
model=Wav2Vec2ForCTC.from_pretrained('boumehdi/wav2vec2-large-xlsr-moroccan-darija')
input_audio, sr = librosa.load('file.wav', sr=16000)
input_values = processor(input_audio, return_tensors="pt", padding=True).input_values
logits = model(input_values).logits
tokens = torch.argmax(logits, axis=-1)
transcription = tokenizer.batch_decode(tokens)
print(transcription)
高级用法
目前文档未提供高级用法示例。
📚 详细文档
属性 |
详情 |
模型类型 |
基于Wav2Vec2-Large-XLSR-53微调的摩洛哥达里贾语自动语音识别模型 |
训练数据 |
从MDVC中提取的57小时标注达里贾语音频,MDVC包含超过1000小时的摩洛哥达里贾语“ary” |
训练和验证指标如下:
训练损失 |
验证损失 |
字错率(Wer) |
0.121300 |
0.103430 |
0.084904 |
📄 许可证
本项目采用Apache-2.0许可证。
联系方式
邮箱:souregh@gmail.com
作者:BOUMEHDI Ahmed