# 低延遲

Qwen2.5 VL 7B Instruct FP8 Dynamic
Apache-2.0
Qwen2.5-VL-7B-Instruct的FP8量化版本,通過vLLM支持高效視覺-文本推理
文本生成圖像 Transformers 英語
Q
RedHatAI
25.18k
1
Mobileclip S2 Timm
MobileCLIP-S2是一種高效的圖文模型,通過多模態強化訓練實現快速推理,在保持較小體積的同時提供卓越的零樣本性能。
文本生成圖像
M
apple
147
4
Whisper Medicalv1
MIT
Distil-Whisper是Whisper large-v3的知識蒸餾版本,專注於英語語音識別,提供更快的推理速度同時保持接近原始模型的準確性。
語音識別 英語
W
Crystalcareai
348
11
Plant Disease Detection Project
其他
MobileNet V2是一種輕量級的卷積神經網絡,專為移動設備設計,在延遲、模型大小和準確性之間取得平衡。
圖像分類 Transformers
P
Diginsa
242.43k
4
Snoop
Snoop是一個基於RVC(Retrieval-based Voice Conversion)技術的音頻轉音頻模型,主要用於語音轉換任務。
語音合成 Transformers
S
sail-rvc
3,997
0
Mobilenet V2 0.75 160
其他
MobileNet V2是一個輕量級的計算機視覺模型,專為移動設備優化,在圖像分類任務中表現優異。
圖像分類 Transformers
M
google
480
2
Sbert Chinese General V2 Distill
這是一個適用於通用語義匹配場景的中文句子嵌入模型,通過蒸餾技術從12層BERT縮減至4層,在保持較好性能的同時顯著提升推理速度。
文本嵌入 Transformers
S
DMetaSoul
43
6
Wav2vec2 Base Ft Keyword Spotting Int8
基於wav2vec2架構的語音關鍵詞檢測模型,經過OpenVINO量化優化
語音識別 Transformers
W
dkurt
14
2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase