X

Xtremedistil L6 H384 Uncased Finetuned Wikitext103

由saghar開發
該模型是基於微軟Xtremedistil模型的輕量級蒸餾版本,在wikitext數據集上進行了微調,適用於文本生成任務。
下載量 18
發布時間 : 3/19/2022

模型概述

這是一個經過微調的輕量級語言模型,基於微軟的Xtremedistil架構,專門針對wikitext數據進行了優化,可用於文本生成和相關自然語言處理任務。

模型特點

輕量級架構
採用6層384維隱藏層的精簡架構,相比完整模型更高效
wikitext優化
專門針對wikitext數據進行了微調,適合處理維基百科風格的文本
高效訓練
使用Adam優化器和線性學習率調度器,在3個epoch內完成微調

模型能力

文本生成
語言模型微調

使用案例

文本生成
維基百科風格文本生成
生成類似維基百科條目的結構化文本
在wikitext驗證集上達到6.5526的損失值
教育研究
語言模型研究
作為輕量級語言模型的研究基準
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase