Ultravox V0 5 Llama 3 1 8b
MIT
基於Llama-3.1-8B-Instruct的多語言音頻文本轉文本模型,支持40多種語言處理
大型語言模型
Transformers 支持多種語言

U
FriendliAI
218
0
Speechless Llama3.2 V0.1
Apache-2.0
Speechless是一款緊湊的開源文本轉語義模型(10億參數),旨在直接將音頻轉換為離散的語義表徵標記,無需依賴傳統的文本轉語音(TTS)模型。
語音合成 支持多種語言
S
homebrewltd
28
3
Speechless Llama3.2 V0.1
Apache-2.0
無言是一個緊湊的開源文本到語義模型(10億參數),旨在直接將音頻轉換為離散的語義標記,無需依賴傳統的文本轉語音(TTS)模型。
語音識別 支持多種語言
S
Menlo
39
3
Wav2vec2 Nepali
基於Facebook的wav2vec2模型微調的尼泊爾語語音識別模型
語音識別
Transformers 其他

W
anish-shilpakar
312
1
Wav2vec Test
這是一個基於wav2vec架構的語音處理測試模型,具體用途和訓練數據未明確說明。
語音識別
Transformers

W
eugenetanjc
73
0
Test Audio
MIT
一個基於Transformer的端到端語音翻譯模型,專門用於法語到英語的語音翻譯任務。
語音識別
Transformers 支持多種語言

T
joaogante
19
0
Wav2vec2 Base Common Voice Fa Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的波斯語語音識別模型,適用於波斯語語音轉文本任務。
語音識別
Transformers

W
zoha
15
0
Wav2vec2 Large Xlsr 300m Nepali
這是一個基於Wav2Vec2架構的尼泊爾語語音識別模型,支持將尼泊爾語語音轉換為文本。
語音識別
Transformers

W
shniranjan
15
0
Wav2vec2 Xls R 1b 21 To En
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型,用於多語言語音到英語的翻譯任務
語音識別
Transformers 支持多種語言

W
facebook
511
3
Wav2vec2 Base 100k Gtzan Music Genres
基於Wav2Vec 2.0架構的音頻分類模型,專門用於音樂流派識別
音頻分類
Transformers

W
m3hrdadfi
405
20
Wav2vec2 Urdu Stt
這是一個基於Wav2Vec2架構的烏爾都語語音識別模型,能夠將烏爾都語語音轉換為文本。
語音識別
Transformers

W
addy88
145
0
Wav2vec2 Dogri Stt
這是一個基於Wav2Vec2架構的自動語音識別(ASR)模型,專門用於識別多格拉語(Dogri)的語音內容。
語音識別
Transformers

W
addy88
30
1
Wav2vec2 Kannada Stt
一個基於Wav2Vec2架構的卡納達語語音識別模型,可直接將卡納達語語音轉換為文本。
語音識別
Transformers

W
addy88
96
1
Wav2vec2 Large Xls R 300m Turkish Colab 4
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型。
語音識別
Transformers

W
nimrah
20
0
Wav2vec2 Large Xlsr Korean
Apache-2.0
基於Wav2Vec2 XLSR架構的韓語自動語音識別(ASR)模型,在Zeroth韓語數據集上表現出色
語音識別
Transformers 韓語

W
kresnik
1.7M
44
Wav2vec2 Malayalam Stt
這是一個基於Wav2Vec2架構的馬拉雅拉姆語語音識別模型,用於將馬拉雅拉姆語語音轉換為文本。
語音識別
Transformers

W
addy88
15
0
Wav2vec2 Xls R 2b En To 15
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型,針對15種語言的語音翻譯任務進行了微調,能夠將英語口語翻譯為多種書面語言。
語音識別
Transformers 支持多種語言

W
facebook
27
1
S2t Small Covost2 En De St
MIT
一個為端到端英語到德語語音翻譯訓練的語音到文本轉換器模型
語音識別
Transformers 支持多種語言

S
facebook
15
1
Wav2vec2 Large Xlsr Turkish Demo
該模型是基於土耳其語Common Voice數據集微調的XLSR-Wav2Vec2語音識別模型,主要用於土耳其語語音轉文本任務。
語音識別
W
patrickvonplaten
18
0
Wav2vec2 Nepali Stt
基於Wav2Vec2架構的尼泊爾語語音識別模型,可直接將尼泊爾語語音轉換為文本
語音識別
Transformers

W
addy88
23
1
S2t Small Covost2 En Fa St
MIT
一個基於Transformer的端到端語音翻譯模型,用於英語到波斯語的語音翻譯任務
語音識別
Transformers 支持多種語言

S
facebook
49
3
Wavlm Base En
基於microsoft/wavlm-base微調的英語自動語音識別(ASR)模型,在english_ASR - CLEAN數據集上訓練,詞錯誤率(WER)為0.0773。
語音識別
Transformers

W
anjulRajendraSharma
17
0
Wav2vec2 Xls R 300m En To 15
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型微調用於多語言語音翻譯任務,支持15種語言的英語到目標語言的翻譯。
語音識別
Transformers 支持多種語言

W
facebook
167
6
S2t Small Mustc En It St
MIT
一個基於Transformer的端到端語音翻譯模型,專為英語到意大利語的語音翻譯任務設計。
語音識別
Transformers 支持多種語言

S
facebook
1,331
1
Wav2vec2 Base Russian Big Kaggle
Apache-2.0
該模型是基於facebook/wav2vec2-base在俄語數據集上微調的語音識別模型
語音識別
Transformers

W
Eyvaz
17
1
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98