🚀 vegam-whipser-medium-ml (വേഗം)
這是將 thennal/whisper-medium-ml 轉換為 CTranslate2 模型格式的項目。該模型可用於 CTranslate2 或基於 CTranslate2 的項目,如 faster-whisper。
🚀 快速開始
本項目可用於語音識別,通過轉換後的模型能在 CTranslate2 及其相關項目中高效運行。
✨ 主要特性
- 支持在 CTranslate2 及基於 CTranslate2 的項目(如 faster-whisper)中使用。
- 可在 GPU 上以 FP16 或 INT8 模式運行,也能在 CPU 上以 INT8 模式運行。
📦 安裝指南
安裝 faster-whisper
pip install faster-whisper
更多安裝細節可 在此查看。
安裝 git-lfs
apt-get install git-lfs
git-lfs 僅用於從 hugging-face 下載模型。對於非 Debian 系統,可參考其他下載方式。
下載模型權重
git lfs install
git clone https://huggingface.co/kurianbenoy/vegam-whisper-medium-ml
💻 使用示例
基礎用法
from faster_whisper import WhisperModel
model_path = "vegam-whisper-medium-ml"
model = WhisperModel(model_path, device="cuda", compute_type="float16")
segments, info = model.transcribe("audio.mp3", beam_size=5)
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
for segment in segments:
print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))
高級用法
from faster_whisper import WhisperModel
model_path = "vegam-whisper-medium-ml"
model = WhisperModel(model_path, device="cuda", compute_type="float16")
segments, info = model.transcribe("00b38e80-80b8-4f70-babf-566e848879fc.webm", beam_size=5)
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
for segment in segments:
print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))
示例輸出:
Detected language 'ta' with probability 0.353516
[0.00s -> 4.74s] പാലം കടുക്കുവോളം നാരായണ പാലം കടന്നാലൊ കൂരായണ
注意:音頻文件 00b38e80-80b8-4f70-babf-566e848879fc.webm 來自 Malayalam Speech Corpus,並與模型權重一起存儲。
🔧 技術細節
本轉換借助了出色的 CTranslate2 庫,利用 Transformers converter for OpenAI Whisper 完成。原始模型通過以下命令進行轉換:
ct2-transformers-converter --model thennal/whisper-medium-ml --output_dir vegam-whisper-medium-ml
📄 許可證
本項目採用 MIT 許可證。
👏 特別感謝
- CTranslate2 和 faster-whisper 的開發者
- Thennal D K
- Santhosh Thottingal
⚠️ 重要提示
模型文件大小為 3.06 GB。
屬性 |
詳情 |
模型類型 |
語音識別模型 |
訓練數據 |
google/fleurs、thennal/IMaSC、mozilla-foundation/common_voice_11_0 |
庫名稱 |
ctranslate2 |