G

Gpt2 Wechsel German

Developed by benjamin
該模型採用WECHSEL方法訓練,通過子詞嵌入的有效初始化實現單語語言模型的跨語言遷移,特別針對德語優化。
Downloads 36
Release Time : 3/2/2022

Model Overview

基於WECHSEL方法訓練的GPT-2德語版本,通過高效的跨語言遷移技術實現德語文本生成能力。

Model Features

跨語言遷移
使用WECHSEL方法實現從英語到德語的參數高效遷移,顯著降低訓練成本。
高效訓練
相比從頭訓練,該方法可減少高達64倍的訓練成本。
性能優越
在困惑度指標上優於同規模從頭訓練的模型。

Model Capabilities

德語文本生成
語言模型遷移

Use Cases

自然語言處理
德語文本生成
生成連貫的德語文本
困惑度26.8,優於從頭訓練的模型(27.63)
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase