G

Gpt2 Wechsel German

benjaminによって開発
このモデルはWECHSEL手法でトレーニングされ、サブワード埋め込みの効率的な初期化を通じて単一言語モデルの言語間転移を実現し、特にドイツ語向けに最適化されています。
ダウンロード数 36
リリース時間 : 3/2/2022

モデル概要

WECHSEL手法でトレーニングされたGPT-2ドイツ語版で、効率的な言語間転移技術によりドイツ語テキスト生成能力を実現。

モデル特徴

言語間転移
WECHSEL手法を使用して英語からドイツ語への効率的なパラメータ転移を実現し、トレーニングコストを大幅に削減。
効率的なトレーニング
ゼロからトレーニングする場合と比較して、最大64倍のトレーニングコスト削減が可能。
優れた性能
パープレキシティ指標において、同規模のゼロからトレーニングしたモデルを上回る性能。

モデル能力

ドイツ語テキスト生成
言語モデル転移

使用事例

自然言語処理
ドイツ語テキスト生成
一貫性のあるドイツ語テキストを生成
パープレキシティ26.8、ゼロからトレーニングしたモデル(27.63)を上回る
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase