Model Selection

Safe Reinforcement Learning

# Safe Reinforcement Learning

Beaver 7b V3.0 GGUF

Beaver-7B-v3.0 is a 7B-parameter large language model based on the LLaMA architecture, focusing on safety and human feedback reinforcement learning (RLHF).

Large Language Model English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase