faster-whisper-large-v3開源語音識別模型 - 免費支持多語言語音轉文字

首頁

Faster Whisper Large V3

由Systran開發

Whisper large-v3是OpenAI開發的大規模多語言自動語音識別(ASR)模型，支持多種語言的語音轉文字任務。

語音識別支持多種語言開源協議:MIT #多語言語音識別 #高精度轉寫 #即時音頻處理

下載量 713.48k

發布時間 : 11/23/2023

模型概述

該模型是基於Transformer架構的自動語音識別系統，能夠將語音轉換為文本，支持廣泛的語言和方言。

模型特點

多語言支持

支持超過100種語言的語音識別，包括許多小眾語言和方言。

高效推理

通過CTranslate2優化，提供更快的推理速度和更低的資源消耗。

高準確率

在多種語言和口音上表現出色的識別準確率。

模型能力

語音轉文字

多語言識別

口音適應

使用案例

轉錄服務

會議記錄

自動記錄會議內容並生成文字稿

提高會議記錄效率，減少人工轉錄時間

播客轉錄

將播客音頻內容轉換為文字

便於內容搜索和索引

輔助技術

即時字幕生成

為視頻或直播生成即時字幕

提高內容可訪問性

🚀 適用於CTranslate2的Whisper large-v3模型

本倉庫包含將 openai/whisper-large-v3 轉換為 CTranslate2 模型格式的內容。該模型可用於CTranslate2或基於CTranslate2的項目，如 faster-whisper。

🚀 快速開始

本模型可以在CTranslate2或者基於CTranslate2的項目（例如 faster-whisper）中使用。

💻 使用示例

基礎用法

from faster_whisper import WhisperModel

model = WhisperModel("large-v3")

segments, info = model.transcribe("audio.mp3")
for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

🔧 技術細節

轉換詳情

原始模型是使用以下命令進行轉換的：

ct2-transformers-converter --model openai/whisper-large-v3 --output_dir faster-whisper-large-v3 \
    --copy_files tokenizer.json preprocessor_config.json --quantization float16

請注意，模型權重以FP16格式保存。在使用 CTranslate2中的 compute_type 選項加載模型時，可以更改此類型。

📚 詳細文檔

有關原始模型的更多信息，請參閱其模型卡片。

📄 許可證

本項目採用MIT許可證。

支持語言

語言	代碼
英語	en
中文	zh
德語	de
西班牙語	es
俄語	ru
韓語	ko
法語	fr
日語	ja
葡萄牙語	pt
土耳其語	tr
波蘭語	pl
加泰羅尼亞語	ca
荷蘭語	nl
阿拉伯語	ar
瑞典語	sv
意大利語	it
印尼語	id
印地語	hi
芬蘭語	fi
越南語	vi
希伯來語	he
烏克蘭語	uk
希臘語	el
馬來語	ms
捷克語	cs
羅馬尼亞語	ro
丹麥語	da
匈牙利語	hu
泰米爾語	ta
挪威語	no
泰語	th
烏爾都語	ur
克羅地亞語	hr
保加利亞語	bg
立陶宛語	lt
拉丁語	la
毛利語	mi
馬拉雅拉姆語	ml
威爾士語	cy
斯洛伐克語	sk
泰盧固語	te
波斯語	fa
拉脫維亞語	lv
孟加拉語	bn
塞爾維亞語	sr
阿塞拜疆語	az
斯洛文尼亞語	sl
卡納達語	kn
愛沙尼亞語	et
馬其頓語	mk
布列塔尼語	br
巴斯克語	eu
冰島語	is
亞美尼亞語	hy
尼泊爾語	ne
蒙古語	mn
波斯尼亞語	bs
哈薩克語	kk
阿爾巴尼亞語	sq
斯瓦希里語	sw
加利西亞語	gl
馬拉地語	mr
旁遮普語	pa
僧伽羅語	si
高棉語	km
紹納語	sn
約魯巴語	yo
索馬里語	so
南非荷蘭語	af
奧克西坦語	oc
格魯吉亞語	ka
白俄羅斯語	be
塔吉克語	tg
信德語	sd
古吉拉特語	gu
阿姆哈拉語	am
意第緒語	yi
老撾語	lo
烏茲別克語	uz
法羅語	fo
海地克里奧爾語	ht
普什圖語	ps
土庫曼語	tk
書面挪威語	nn
馬耳他語	mt
梵語	sa
盧森堡語	lb
緬甸語	my
藏語	bo
他加祿語	tl
馬達加斯加語	mg
阿薩姆語	as
韃靼語	tt
夏威夷語	haw
林加拉語	ln
豪薩語	ha
巴什基爾語	ba
爪哇語	jw
巽他語	su
粵語	yue

屬性	詳情
標籤	音頻、自動語音識別
庫名稱	ctranslate2