D

Duo

s-sahooによって開発
DUOはTransformersライブラリに基づく事前学習モデルで、マスク言語モデリングタスクに特化しており、自然言語処理分野に適用されます。
ダウンロード数 212
リリース時間 : 2/18/2025

モデル概要

DUOモデルはマスク言語モデリング用の事前学習モデルで、GPT2 - mediumと似たパラメータ規模を持ち、OpenWebTextコーパスで学習されています。

モデル特徴

大きなコンテキスト長
1024のコンテキスト長をサポートし、長文テキストタスクの処理に適しています。
効率的な学習
OpenWebTextコーパスで100万ステップの学習を行い、モデルの性能を最適化しました。
GPT2 - mediumと似た規模
パラメータ規模はGPT2 - mediumに近く、約1.3億個の非埋め込みパラメータです。

モデル能力

マスク言語モデリング
テキスト生成
自然言語理解

使用事例

自然言語処理
テキスト補完
マスク言語モデリング能力を使って欠けているテキスト部分を補完します。
言語モデルの微調整
ベースモデルとして、特定のタスクの微調整に使用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase