G

Gerpt2

由benjamin開發
GerPT2是基於GPT2架構的德語大語言模型,在CC-100和德語維基百科數據集上訓練,性能優於同類德語GPT2模型。
下載量 48
發布時間 : 3/2/2022

模型概述

德語版GPT2大模型,支持德語文本生成任務,在困惑度指標上表現優異。

模型特點

卓越的德語性能
在CC-100和德語維基百科數據集上的困惑度指標顯著優於dbmdz/german-gpt2模型
英語到德語的語義映射
通過generate_aligned_wte.py腳本實現英語到德語的詞嵌入對齊,提升生成質量
優化的生成控制
提供bad_words_ids等參數配置,有效控制生成文本的終止條件

模型能力

德語文本生成
上下文理解
長文本生成

使用案例

內容創作
德語文章生成
根據提示生成連貫的德語文章
生成文本具有較低的困惑度指標
語言研究
德語語言模型研究
作為德語NLP研究的基線模型
提供優於同類模型的基準性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase