🚀 適用於CTranslate2的Whisper large-v3模型
本倉庫包含將 openai/whisper-large-v3 轉換為 CTranslate2 模型格式的內容。該模型可用於CTranslate2或基於CTranslate2的項目,如 faster-whisper。
🚀 快速開始
本模型可以在CTranslate2或者基於CTranslate2的項目(例如 faster-whisper)中使用。
💻 使用示例
基礎用法
from faster_whisper import WhisperModel
model = WhisperModel("large-v3")
segments, info = model.transcribe("audio.mp3")
for segment in segments:
print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))
🔧 技術細節
轉換詳情
原始模型是使用以下命令進行轉換的:
ct2-transformers-converter --model openai/whisper-large-v3 --output_dir faster-whisper-large-v3 \
--copy_files tokenizer.json preprocessor_config.json --quantization float16
請注意,模型權重以FP16格式保存。在使用 CTranslate2中的 compute_type
選項 加載模型時,可以更改此類型。
📚 詳細文檔
有關原始模型的更多信息,請參閱其 模型卡片。
📄 許可證
本項目採用MIT許可證。
支持語言
語言 |
代碼 |
英語 |
en |
中文 |
zh |
德語 |
de |
西班牙語 |
es |
俄語 |
ru |
韓語 |
ko |
法語 |
fr |
日語 |
ja |
葡萄牙語 |
pt |
土耳其語 |
tr |
波蘭語 |
pl |
加泰羅尼亞語 |
ca |
荷蘭語 |
nl |
阿拉伯語 |
ar |
瑞典語 |
sv |
意大利語 |
it |
印尼語 |
id |
印地語 |
hi |
芬蘭語 |
fi |
越南語 |
vi |
希伯來語 |
he |
烏克蘭語 |
uk |
希臘語 |
el |
馬來語 |
ms |
捷克語 |
cs |
羅馬尼亞語 |
ro |
丹麥語 |
da |
匈牙利語 |
hu |
泰米爾語 |
ta |
挪威語 |
no |
泰語 |
th |
烏爾都語 |
ur |
克羅地亞語 |
hr |
保加利亞語 |
bg |
立陶宛語 |
lt |
拉丁語 |
la |
毛利語 |
mi |
馬拉雅拉姆語 |
ml |
威爾士語 |
cy |
斯洛伐克語 |
sk |
泰盧固語 |
te |
波斯語 |
fa |
拉脫維亞語 |
lv |
孟加拉語 |
bn |
塞爾維亞語 |
sr |
阿塞拜疆語 |
az |
斯洛文尼亞語 |
sl |
卡納達語 |
kn |
愛沙尼亞語 |
et |
馬其頓語 |
mk |
布列塔尼語 |
br |
巴斯克語 |
eu |
冰島語 |
is |
亞美尼亞語 |
hy |
尼泊爾語 |
ne |
蒙古語 |
mn |
波斯尼亞語 |
bs |
哈薩克語 |
kk |
阿爾巴尼亞語 |
sq |
斯瓦希里語 |
sw |
加利西亞語 |
gl |
馬拉地語 |
mr |
旁遮普語 |
pa |
僧伽羅語 |
si |
高棉語 |
km |
紹納語 |
sn |
約魯巴語 |
yo |
索馬里語 |
so |
南非荷蘭語 |
af |
奧克西坦語 |
oc |
格魯吉亞語 |
ka |
白俄羅斯語 |
be |
塔吉克語 |
tg |
信德語 |
sd |
古吉拉特語 |
gu |
阿姆哈拉語 |
am |
意第緒語 |
yi |
老撾語 |
lo |
烏茲別克語 |
uz |
法羅語 |
fo |
海地克里奧爾語 |
ht |
普什圖語 |
ps |
土庫曼語 |
tk |
書面挪威語 |
nn |
馬耳他語 |
mt |
梵語 |
sa |
盧森堡語 |
lb |
緬甸語 |
my |
藏語 |
bo |
他加祿語 |
tl |
馬達加斯加語 |
mg |
阿薩姆語 |
as |
韃靼語 |
tt |
夏威夷語 |
haw |
林加拉語 |
ln |
豪薩語 |
ha |
巴什基爾語 |
ba |
爪哇語 |
jw |
巽他語 |
su |
粵語 |
yue |
標籤
屬性 |
詳情 |
標籤 |
音頻、自動語音識別 |
庫名稱 |
ctranslate2 |