# 相對位置嵌入

Wav2vec2 Conformer Rel Pos Large 100h Ft
Apache-2.0
採用相對位置嵌入技術的Wav2Vec2-Conformer大型語音識別模型,基於Librispeech 100小時語音數據微調
語音識別 Transformers 英語
W
facebook
99
0
Wav2vec2 Conformer Rel Pos Large 960h Ft
Apache-2.0
基於16kHz採樣語音音頻的Wav2Vec2-Conformer模型,採用相對位置嵌入技術,在960小時Librispeech數據上預訓練和微調
語音識別 Transformers 英語
W
facebook
1,038
5
Tapas Base Finetuned Wtq
Apache-2.0
TAPAS是一個基於Transformer的表格問答模型,通過自監督學習在維基百科表格數據上預訓練,並在WTQ等數據集上微調。
問答系統 Transformers 英語
T
google
23.03k
217
Tapas Small Finetuned Wtq
Apache-2.0
該模型是TAPAS的小型版本,專門針對WikiTable Questions數據集進行微調,用於表格問答任務。
問答系統 Transformers 英語
T
google
406
5
Tapas Tiny
Apache-2.0
TAPAS是一種基於Transformer的表格問答模型,通過自監督方式在維基百科英文表格數據上預訓練,支持表格問答和蘊含判斷任務。
大型語言模型 Transformers 英語
T
google
44
0
Tapas Medium Finetuned Wtq
Apache-2.0
該模型是基於TAPAS架構的中型表格問答模型,在WikiTable Questions數據集上微調,適用於表格數據問答任務。
問答系統 Transformers 英語
T
google
77
2
Tapas Large Finetuned Wtq
Apache-2.0
TAPAS是基於BERT架構的表格問答模型,通過自監督方式在維基百科表格數據上預訓練,支持對錶格內容進行自然語言問答
問答系統 Transformers 英語
T
google
124.85k
141
Tapas Tiny Finetuned Wtq
Apache-2.0
TAPAS是一個針對表格問答任務優化的微型Transformer模型,通過中間預訓練和多數據集鏈式微調實現表格理解能力
問答系統 Transformers 英語
T
google
1,894
1
Beit Large Patch16 224 Pt22k Ft22k
Apache-2.0
BEiT是一種基於視覺Transformer(ViT)的圖像分類模型,通過自監督方式在ImageNet-22k上預訓練並在相同數據集上微調。
圖像分類
B
microsoft
1,880
5
Tapas Mini Finetuned Wtq
Apache-2.0
該模型是基於TAPAS架構的迷你版本,專門針對WikiTable Questions (WTQ)數據集進行微調,用於表格問答任務。
問答系統 Transformers 英語
T
google
35
2
Beit Base Patch16 224 Pt22k
Apache-2.0
BEiT是一種基於視覺Transformer的模型,通過自監督學習在ImageNet-21k數據集上預訓練,用於圖像分類任務。
圖像分類
B
microsoft
2,647
3
Beit Base Patch16 224 Pt22k Ft22k
Apache-2.0
BEiT是一種基於視覺Transformer(ViT)的圖像分類模型,通過自監督方式在ImageNet-22k上預訓練,並在相同數據集上微調。
圖像分類
B
microsoft
546.85k
76
Tapas Base Finetuned Sqa
Apache-2.0
基於BERT架構的表格問答模型,通過中間預訓練增強數值推理能力,在SQA數據集上微調完成
問答系統 Transformers 英語
T
google
1,867
6
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase