Sheared LLaMA 2.7B
Apache-2.0
Sheared-LLaMA-2.7B是基於Llama-2-7b通過剪枝和繼續預訓練得到的輕量級語言模型,僅消耗50B tokens預算。
大型語言模型
Transformers

S
princeton-nlp
1,131
60
Bert Base Uncased Squadv1 X1.96 F88.3 D27 Hybrid Filled Opt V1
MIT
基於BERT-base uncased模型在SQuAD v1上微調並優化的問答模型,通過剪枝技術保留43%原始權重,推理速度提升1.96倍
問答系統
Transformers 英語

B
madlag
20
0
Bert Base Uncased Sst2 Acc91.1 D37 Hybrid
Apache-2.0
該模型是基於bert-base-uncased在SST-2數據集上微調得到的文本分類模型,通過nn_pruning庫進行了剪枝優化,保留了原模型51%的權重,準確率達到91.17%。
文本分類
Transformers 英語

B
echarlaix
172
0
Bert Base Uncased Squadv1 X2.01 F89.2 D30 Hybrid Rewind Opt V1
MIT
基於BERT-base uncased模型在SQuAD v1上微調的問答系統模型,通過nn_pruning庫進行剪枝優化,推理速度提升2.01倍,F1得分提升0.69。
問答系統
Transformers 英語

B
madlag
22
0
Bert Base Uncased Sparse 70 Unstructured
這是BERT基礎模型的剪枝版本,達到70%的稀疏度,適用於下游任務的微調。
大型語言模型
Transformers 英語

B
Intel
28
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98