G

Gpt2 Wechsel German

由benjamin開發
該模型採用WECHSEL方法訓練,通過子詞嵌入的有效初始化實現單語語言模型的跨語言遷移,特別針對德語優化。
下載量 36
發布時間 : 3/2/2022

模型概述

基於WECHSEL方法訓練的GPT-2德語版本,通過高效的跨語言遷移技術實現德語文本生成能力。

模型特點

跨語言遷移
使用WECHSEL方法實現從英語到德語的參數高效遷移,顯著降低訓練成本。
高效訓練
相比從頭訓練,該方法可減少高達64倍的訓練成本。
性能優越
在困惑度指標上優於同規模從頭訓練的模型。

模型能力

德語文本生成
語言模型遷移

使用案例

自然語言處理
德語文本生成
生成連貫的德語文本
困惑度26.8,優於從頭訓練的模型(27.63)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase