知識蒸餾BERT

# 知識蒸餾BERT

Bert L12 H256 A4

基於知識蒸餾技術預訓練的輕量級BERT模型，隱藏層維度為256，配備4個注意力頭，適用於掩碼語言建模任務。

大型語言模型

Bert L12 H240 A12

基於知識蒸餾技術預訓練的BERT變體模型，隱藏層維度為240，配備12個注意力頭，適用於掩碼語言建模任務。

大型語言模型

Prunedbert L12 H256 A4 Finetuned

基於BERT架構的輕量級模型，通過知識蒸餾技術預訓練，隱藏層維度為256，配備4個注意力頭。

大型語言模型

Bert L12 H384 A6

基於BookCorpus數據集通過知識蒸餾技術預訓練的輕量化BERT模型，隱藏層維度縮減至384，採用6個注意力頭。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase