Model Selection

Preference Alignment Training

# Preference Alignment Training

TRL is a reinforcement learning library based on the Transformer architecture for training and fine-tuning language models.

Large Language Model

Tango 2 is an improved text-to-audio generation model based on Tango, achieving alignment training for audio generation through Direct Preference Optimization (DPO) technology

Audio Generation

Transformers English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase