bert-base-uncased-sst2_from_bert-large-uncased-sst2開源模型

首頁

Bert Base Uncased Sst2 From Bert Large Uncased Sst2

由yoshitomo-matsubara開發

使用bert-large-uncased作為教師模型，通過知識蒸餾技術微調bert-base-uncased的SST-2情感分析模型

文本分類

Transformers

英語開源協議:Apache-2.0 #情感分析蒸餾 #GLUE基準優化 #無代碼微調

下載量 242

發布時間 : 3/2/2022

模型概述

該模型是在SST-2情感分析數據集上通過知識蒸餾技術優化的BERT-base模型，使用更大的BERT-large作為教師模型進行指導訓練，旨在保持較小模型尺寸的同時提升情感分類準確率。

模型特點

知識蒸餾優化

採用torchdistill框架實現BERT-large到BERT-base的知識蒸餾，在保持較小模型尺寸的同時提升性能

GLUE基準驗證

模型結果已提交至GLUE基準測試，綜合得分達78.9分

可復現研究

提供完整訓練配置和超參數，支持無代碼化實驗復現

模型能力

英語文本情感分析

二分類情感判斷(正面/負面)

知識蒸餾模型壓縮

使用案例

情感分析

影評情感分析

分析電影評論的情感傾向(正面/負面)

在SST-2測試集上達到較高準確率

產品評論分類

對電商平臺用戶評論進行情感分類

教育研究

知識蒸餾案例研究

作為NLP領域知識蒸餾技術的教學示例

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Bert Base Uncased Sst2 From Bert Large Uncased Sst2

模型概述

模型特點

模型能力

使用案例

🚀 BERT-base-uncased微調模型

🚀 快速開始

📚 詳細文檔

📄 許可證